- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在处理以下类型的数据。
itemid category subcategory title 1 10000010 Транспорт Автомобили с пробегом Toyota Sera, 1991 2 10000025 Услуги Предложения услуг Монтаж кровли 3 10000094 Личные вещи Одежда, обувь, аксессуары Костюм Steilmann 4 10000101 Транспорт Автомобили с пробегом Ford Focus, 2011 5 10000132 Транспорт Запчасти и аксессуары Турбина 3.0 Bar 6 10000152 Транспорт Автомобили с пробегом ВАЗ 2115 Samara, 2005
现在我运行以下命令
import pandas as pd trainingData = pd.read_table("train.tsv",nrows=10, header=0,encoding='utf-8') trainingData['itemid'].head() 0 10000010 1 10000025 2 10000094 3 10000101 4 10000132 Name: itemid
此时一切都很好,但是当我做类似的事情时
trainingData['itemid','category'].head() Error: --------------------------------------------------------------------------- UnicodeDecodeError Traceback (most recent call last) /home/vikram/Documents/Avito/ in () ----> 1 trainingData[['itemid','category']].head() /usr/lib/python2.7/dist-packages/IPython/core/displayhook.pyc in __call__(self, result) 236 self.start_displayhook() 237 self.write_output_prompt() --> 238 format_dict = self.compute_format_data(result) 239 self.write_format_data(format_dict) 240 self.update_user_ns(result) /usr/lib/python2.7/dist-packages/IPython/core/displayhook.pyc in compute_format_data(self, result) 148 MIME type representation of the object. 149 """ --> 150 return self.shell.display_formatter.format(result) 151 152 def write_format_data(self, format_dict): /usr/lib/python2.7/dist-packages/IPython/core/formatters.pyc in format(self, obj, include, exclude) 124 continue 125 try: --> 126 data = formatter(obj) 127 except: 128 # FIXME: log the exception /usr/lib/python2.7/dist-packages/IPython/core/formatters.pyc in __call__(self, obj) 445 type_pprinters=self.type_printers, 446 deferred_pprinters=self.deferred_printers) --> 447 printer.pretty(obj) 448 printer.flush() 449 return stream.getvalue() /usr/lib/python2.7/dist-packages/IPython/lib/pretty.pyc in pretty(self, obj) 352 if callable(obj_class._repr_pretty_): 353 return obj_class._repr_pretty_(obj, self, cycle) --> 354 return _default_pprint(obj, self, cycle) 355 finally: 356 self.end_group() /usr/lib/python2.7/dist-packages/IPython/lib/pretty.pyc in _default_pprint(obj, p, cycle) 472 if getattr(klass, '__repr__', None) not in _baseclass_reprs: 473 # A user-provided repr. --> 474 p.text(repr(obj)) 475 return 476 p.begin_group(1, ' 456 self.to_string(buf=buf) 457 value = buf.getvalue() 458 if max([len(l) for l in value.split('\n')]) > terminal_width: /usr/lib/pymodules/python2.7/pandas/core/frame.pyc in to_string(self, buf, columns, col_space, colSpace, header, index, na_rep, formatters, float_format, sparsify, nanRep, index_names, justify, force_unicode) 1024 index_names=index_names, 1025 header=header, index=index) -> 1026 formatter.to_string(force_unicode=force_unicode) 1027 1028 if buf is None: /usr/lib/pymodules/python2.7/pandas/core/format.pyc in to_string(self, force_unicode) 176 for i, c in enumerate(self.columns): 177 if self.header: --> 178 fmt_values = self._format_col(c) 179 cheader = str_columns[i] 180 max_len = max(max(len(x) for x in fmt_values), /usr/lib/pymodules/python2.7/pandas/core/format.pyc in _format_col(self, col) 217 float_format=self.float_format, 218 na_rep=self.na_rep, --> 219 space=self.col_space) 220 221 def to_html(self): /usr/lib/pymodules/python2.7/pandas/core/format.pyc in format_array(values, formatter, float_format, na_rep, digits, space, justify) 424 justify=justify) 425 --> 426 return fmt_obj.get_result() 427 428 /usr/lib/pymodules/python2.7/pandas/core/format.pyc in get_result(self) 471 fmt_values.append(float_format(v)) 472 else: --> 473 fmt_values.append(' %s' % _format(v)) 474 475 return _make_fixed_width(fmt_values, self.justify) /usr/lib/pymodules/python2.7/pandas/core/format.pyc in _format(x) 457 else: 458 # object dtype --> 459 return '%s' % formatter(x) 460 461 vals = self.values /usr/lib/pymodules/python2.7/pandas/core/common.pyc in _stringify(col) 503 def _stringify(col): 504 # unicode workaround --> 505 return unicode(col) 506 507 def _maybe_make_list(obj):UnicodeDecodeError: 'ascii' codec can't decode byte 0xd0 in position 0: ordinal not in range(128)
请帮我正确“显示”数据。
最佳答案
我遇到了由 IPython 引起的相同问题,它无法显示 Pandas head()
函数返回的非 ASCII 文本。事实证明,Python 的默认编码在我的机器上设置为 'ascii'
。你可以检查这个
import sys
sys.getdefaultencoding()
解决方案是将默认编码重新设置为 UTF-8:
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
在此之后,IPython 可以正确显示带有非 ASCII 字符的 Pandas 数据帧。
请注意,reload
调用是使 setdefaultencoding
功能可用所必需的。没有它你会得到错误:
AttributeError: 'module' object has no attribute 'setdefaultencoding'
关于python - 如何打印包含一些俄语的 Pandas 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24894213/
我必须设计一个俄语版的网站。我从翻译那里得到文本。我把它复制到 Dreamweaver 的代码中,但它不起作用。 我有平常的脑袋: 我该怎么办? 最佳答案 您应该将文件的编码更改为 UTF-8。您可
我正在使用 google-api-spelling-java jar 库。而且我需要使用更多的语言来使用,其中之一就是俄语。我在哪里可以获得相同的库但具有更多语言? 最佳答案 您可以在此处下载源代码并
我有一张表,用于存储一些文本标签。最初它是使用 latin_swedish_ci(默认)排序规则构建的。 现在我需要支持其他语言,例如俄语。我有两个使用这些标签的页面。一个显示它们很好,尽管该表仍然使
尝试匹配字符串“Манихина Галина Владимировна”和其他相同格式的字符串。也就是三个字的专有名词。我是正则表达式的新手,不确定我的陈述有什么问题。 import java.ut
我应该使用哪种排序规则将阿拉伯语、俄语、英语和德语字符保存到数据库中? 我的列设置是nvarchar(100) 我目前已将其设置为: SQL_Latin1_General_Cp1256_CI_AS 它
我有一个覆盖了 onKeyDown() 的自定义 View 。当我使用标准的 Android 英语(或意大利语)软键盘时它工作正常,但是当我将设备设置为俄语时,按键事件永远不会到达 onKeyDown
也许有人知道从中检索翻译的最佳方式是什么。是否有用于阅读 Multitran 词典数据库的图书馆?我的目标是一个简单的程序,它将检索给定的俄语单词的英文翻译。 最佳答案 也许你可以使用 StarDic
我尝试使用提要解析器阅读 RSS 提要。 import feedparser url = 'http://example.com/news.xml' d=feedparser.parse(url) f
我正在尝试通过 setlocale 使用俄语: setlocale(LC_TIME,"ru_RUS.utf8"); echo strftime("%A, %B %d", time()); 输出是:8
我在数据库中有一个具有俄罗斯值(value)观的项目。我需要做的就是附和他们,但事实证明这比预期的要困难。所有俄语字符都只是作为问号打印。 IE: ??? ? ????????对于我尝试过的每种编码,
我已经花了几天时间,我做错了什么?我就是不能把俄语字符弄出来。尝试了上面的所有代码 - 它没有帮助。下面我用不同的选项引用我的代码。请帮帮我。 库连接如下 dependencies { imp
我正在我的 Android 设备(Motorola Defy,2.1)上调试应用程序,该应用程序从网络获取俄语 HTML 页面,但无法显示它。它显示为 link text 。HTML 页面采用 UTF
过去几个小时我一直对俄语制表符分隔的 txt 文件感到困惑。其外观如下: CODE AD_GROUP KEYWORD MATCH_TYPE 009966 Автостраховка
我需要在基于 Spring 的项目中为俄语和葡萄牙语等语言本地化一组 JSP 页面。 我尝试的是,使用 EL 和 JSTL。但是它们都不支持上述语言。 (显示迷失方向的字符符号) JSP 片段(用于
我对我的英语感到抱歉。我正在尝试使用 PdfPTable(iText 库)创建表。表格显示空列![在此处输入图像描述][1] public class CreatePDF { File file; B
我正在尝试在包含非拉丁字符的 Qt/C++ 软件上加载文件。一个使用俄语文件名的用户报告的问题,我试图用下面的代码快速修复它。 示例文件名是(我不会读或写俄语!):Летний сад.dgr boo
是否可以在 javascript 的正则表达式中使用俄语字符? 也许使用\p{Cyrillic}? 如果是,请提供一个基本的用法示例。 例子: var str1 = "абв прв фву"; va
2016 年 31 日 15:10 декабря不是英语。 декабря = 十二月 DateTime.Parse("31/December/2016").ToString("yyyymmdd")
当我将数据添加到工作簿时,需要将公式从较早的单元格复制到新单元格。 我使用以下公式来计算我的增长率: =WENN(ODER(K9="";L9="");"";WENNFEHLER((L9-K9)/K9;
如题,我不知道如何在C中解析包含字母字符和来自其他语言的特殊字符的字符串。谁能帮助我如何在C中区分它们?。我是否需要安装一些可选组件来帮助C接受字符?(我在linux环境中)。非常感谢您的回复。 最佳
我是一名优秀的程序员,十分优秀!