- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在清理推文时遇到问题。我有一个将推文保存在 csv 中的过程,然后我对数据进行 pandas 数据框。
x 是来 self 的数据框的一条推文:
'b\'RT @LBC:詹姆斯·奥布莱恩谈到杰弗里·考克斯等待的法律建议:“我们正在等待一位未经选举的专家告诉我们是否需要提前\\xe2\\x80\\xa6\''
更多推文:“b'RT @suzannelynch1:同时在#Washington...#Congress 的近二十名成员在 #StPatricksDay 前夕写信给 #TheresaMay 访问 wa\\xe2\\x80\\xa6'
b"RT @KMTV_Kent:#KentTonight 民意调查:\\n肯特郡议员今天将就特蕾莎·梅的#Brexit 协议(protocol)发表意见。@SirRogerGaleMP 表示他会支持\\xe2\\x80\\xa6"
结果应该是这样的:詹姆斯·奥布莱恩 (James O'Brien) 谈到杰弗里·考克斯 (Geoffrey Cox) 等待的法律建议:“我们正在等待一位未经选举产生的专家来告诉我们是否需要”
(保留主题标签,只需删除 utf8 字符即可)
我想清理这条推文。我尝试将正则表达式与 re.sub(my_regex)、re.compile ...
我尝试过不同的正则表达式:([\U00010000-\U0010ffff],r'@[A-Za-z0-9]+',https?://[A-Za-z0-9./]+)
我也这样尝试过:
x.encode('ascii','ignore').decode('utf-8')
由于双反斜杠,它不起作用,当我这样做时它起作用:
'to tell us whether or not fore\xe2\x80\xa6'.encode('ascii','ignore').decode('utf-8')
它返回我:
'to tell us whether or not fore'
有人知道怎么清洗吗?非常感谢 !
最佳答案
看看这是否有帮助
a = 'b\'RT @LBC: James O\\\'Brien on Geoffrey Cox\\\'s awaited legal advice: "We are waiting for a single unelected expert to tell us whether or not fore\\xe2\\x80\\xa6\''
chars = re.findall("""[\s"'#]+\w+""",a)
''.join([c for c in chars if c])
输出
James O'Brien on Geoffrey Cox's awaited legal advice: "We are waiting for a single unelected expert to tell us whether or not for'
关于python - 清理推文的问题(表情符号、笑脸......),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55241606/
我遇到了 Handlebars 表达式 {{!< default}}我不明白。在问这个问题之前,我曾尝试在谷歌上搜索答案。但是,我找不到任何答案。谁能解释一下这个表达式是什么意思? 最佳答案 在 Ha
经常有朋友问起,如何在im即时通讯中实现发送图片、视频、语音和表情? 为此,小编特意写了一个vue版本的demo,实现了图片视频文件和表情的的发送,参考这个demo源代码,相信你就可以轻松的用un
这里是一个网站 ( https://twitchemotes.com/apidocs ),它展示了一个用于获取 twitch 表情的 API(基本上是描述属于不同用户的一组图像的 json)。 API
使用 Python 3,像下面这样的简单脚本应该按预期运行,但似乎会因 unicode 表情字符串而窒息: import re phrase = "(╯°□°)╯ ︵ ┻━┻" pattern = r
我试图弄清楚表情符号(表情)选择是如何在 Facebook 应用和 Google Hangouts 应用上实现的。我查看了 Android API 示例中的 SoftKeyboard 演示应用程序,但
我正在尝试在 android 通知文本中显示笑脸(或图像范围)。它不起作用。有人知道怎么做吗?谢谢。 代码如下: SpannableStringBuilder builder = new Spanna
我是一名优秀的程序员,十分优秀!