作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试自动化电子邮件发送服务,该服务将某人的公交车站发送到他的邮箱。
为此,我需要从希伯来语网站提取一些数据,但我得到的只是一个包含乱码的文件。
我已经尝试编码为 utf8
,但我得到的只是更多的乱码。
import requests
import pandas as pd
url = 'http://yit.maya-tour.co.il/yit-pass/Drop_Report.aspx?client_code=2660&coordinator_code=2669'
html = requests.get(url).content
df_list = pd.read_html(html)
df = df_list[-1]
print(df)
df.to_csv('my data.csv')
我期望的是:
רשימת פיזורים
שם הנהג סוג הרכב הערות תאור שעה
מוניות הקניון מונית A35 פיזור-שדרות 06:30
但是得到了:
×©× ×× ×× ×¡×× ×ר×× ... ת××ר שע×
0 ××× ××ת ××§× ××× ××× ×ת ... פ×××ר-ש×ר×ת 06:30
最佳答案
响应对象的 .content
属性以字节为单位为您提供数据,请尝试使用 .text
代替:
html = requests.get(url).text
更多细节在这里: What is the difference between 'content' and 'text'
关于python-3.x - 如何修复 python 中希伯来语字符串的乱码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57548873/
我是一名优秀的程序员,十分优秀!