gpt4 book ai didi

php - 无法让 PHP 接受漂亮的 Python 汤脚本中的 POUND 符号

转载 作者:行者123 更新时间:2023-12-01 05:58:37 26 4
gpt4 key购买 nike

所以我有一个脚本可以从事件网页中提取信息。网址是这样的:http://everguide.com.au/melbourne/event/2012-jul-14/colour/

这个 php 脚本正在调用 python 脚本(它是 for 循环的一部分):

${"tmp" . $i} = utf8_encode (exec("python myscrape.py ${"eu" . $i}"));

它传递一个 URL。 python脚本是这样的:

# -*- coding: utf-8 -*-
import sys
URL = sys.argv[1]
#$URL = 'http://everguide.com.au/melbourne/event/2012-jul-14/colour/'

import urllib2
req = urllib2.Request(URL)
response = urllib2.urlopen(req)
html = response.read()

from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(html.decode('utf-8'))
soup.prettify()

import re


for node in soup.findAll(itemprop="name"):
n = ''.join(node.findAll(text=True))
for node in soup.findAll(itemprop="url"):
v = ''.join(node.findAll(text=True))

for node in soup.findAll("div", { "class" : "time" }):
d = ''.join(node.findAll(text=True))

for node in soup.findAll("a", { "id" : "ctl00_holderBody_ctl00_lnkCat" }):
c = ''.join(node.findAll(text=True))

vu = v
vu.encode('utf-8', 'xmlcharrefreplace')
re.escape(vu)

print n,"|", d,"|", vu,"|", c

效果非常好,但只能返回到 VU 之前的 or 管道 - 它不能超越它!

所有文件(HTML 和 php)都设置了 UTF-8 编码。

当V变量中有特殊字符时,它会中断并停止。如果没有特殊字符,它就可以正常工作。

预期输出是:

Colour | 14 July @ 7:30PM | 1000 £ Bend | Clubs & Parties

在服务器上运行脚本(使用相同的 python 命令)但通过 PHP 运行脚本时可以看到此输出 - 我无法重新获取 Venue 字符串!

请帮忙

瑞克

最佳答案

vu.encode 返回编码字符串...因为您没有分配编码结果,所以这只是被丢弃。你试过吗

vu = vu.encode('utf-8', 'xmlcharrefreplace')

您还需要跳过转义,因为它会弄乱编码的 unicode。

关于php - 无法让 PHP 接受漂亮的 Python 汤脚本中的 POUND 符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11447554/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com