python - Plotly:从 csv 中按年份绘制用户输入的词频-6ren

python - Plotly:从 csv 中按年份绘制用户输入的词频

转载作者：太空宇宙更新时间：2023-11-03 15:31:38

24

4

我想绘制用户输入中单词随时间变化的单词使用情况。例如。用户输入“begab，social，demokrat”。这些术语存储在变量u_input中。我想使用 startswith() 方法在使用术语“social”等时包含“social、socialismus、socialreform”等词。

作为准备工作，我将历史普鲁士报纸语料库的 2300 个 xml 文件合并到 csv 文件中，其中包含有关“年份、字数、计数”的信息:

year| word        | count
----|-------------|----
1864|befürchtete  |1
1864|befürchtungen|1
1864|begab        |1
1864|begab        |2
1864|begab        |3
1864|begab        |5
1864|begaben      |1
1864|begaben      |3
1865|begab        |2
1865|begab        |2

然后，我使用 Pandas 对数据进行分组，以便获得每年的单词总数，并将数据保存为新的 csv 文件“pandas_dict.csv”:

year| word        | count
----|-------------|----
1864|befürchtete  |1
1864|befürchtungen|1
1864|begab        |11
1864|begaben      |4
1865|begab        |4

我现在想使用plotly(离线)绘制一个图，显示示例术语“social、conserv、kommuni”的单词使用图。 (原因:在这个例子中，我想比较报纸对社会党、保守派和共产主义者的报道，更具体地说，与政党相关的词语的普遍突出程度，因此所有“社会”或“共产主义”。 )

不幸的是，我读到的所有示例中的代码都不起作用，因为我找到的所有示例中都没有包含任何类型的机制来仅显示 u_input 中的术语的图表。

import plotly as py
import plotly.graph_objs as go
import pandas as pd

# Create DataFrame from prepared csv
df = pd.read_csv(self.dir + self.dict_dir + 'pandas_dict.csv', header=None, names=['year', 'word', 'count'])
# define data for plotting - how do I incorporate u_input?
trace1 = go.Scatter(x=df['year'], y=df['count'], mode='lines', name='test')

layout = go.Layout(title='Word usage over time', plot_bgcolor='rgb(230, 230,230)')
fig = go.Figure(data=[trace1], layout=layout)

# Plot data
py.offline.plot(fig)

这是我用 NLTK 创建的一个旧示例，它大致显示了我想用plotly 做什么:

最佳答案

您可以首先通过 contains 过滤数据帧中的每个单词(df[df['word'].str.contains(word)]
接下来通过 groupby 按年份对所有内容进行分组
最终仅报告“count”并对其求和 (['count'].aggregate(sum))
为了绘制它，请迭代 u_input 中的单词并为每个单词添加跟踪，

<小时/>

import pandas as pd
import plotly
import io

txt="""year|word|count
1864|befürchtete|1
1864|befürchtungen|1
1864|begab|11
1864|begaben|4
1865|begab|4
1864|kommuni|3
1864|social|2
1864|conserv|5
1865|kommuni|6
1865|social|3
1865|conserv|4
1866|kommuni|8
1866|social|2
1866|conserv|6
1867|conservativ|4
1867|conservative|1
1867|socialist|1
1867|socialisti|2
1867|nonsense|99
1867|kommunist|4
1867|kommuni|2
"""

u_input = ['kommuni', 'social', 'conserv']

df = pd.read_csv(io.StringIO(txt), sep='|')

#filter the dataframe according to u_input
df = df[df['word'].str.contains('|'.join(u_input))]

traces = [plotly.graph_objs.Scatter(x=df['year'][df['word'].str.contains(word)],
                                    y=df[df['word'].str.contains(word)].groupby(['year'])['count'].aggregate(sum),
                                    name=word, mode='lines') for word in u_input]

layout = plotly.graph_objs.Layout(xaxis=dict(tickvals=df['year'].unique()))
fig = plotly.graph_objs.Figure(data=traces, layout=layout)
plotly.offline.plot(fig)

关于python - Plotly:从 csv 中按年份绘制用户输入的词频，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42858066/

24

4

0

文章推荐： c# - 在 Asp.Net MVC 5 中实现多个数据库的最佳实践是什么？

文章推荐： c# - Entity Framework SaveChangesAsync 阻塞了我的 UI？

文章推荐： c# - 如何以编程方式提高 ScrollViewer 速度

文章推荐： c# - 在 3D Kinect 中识别手语

plotly - plotly 标签
我想更改 plotly(_express) 图中的构面标签。剧情如下: import plotly.express as px tips = px.data.tips() fig = px.scatt
plotly - Plotly 中所有地理范围的列表
我正在尝试使用 plotly.js 在 map 上绘制数据。我知道您可以通过以下方式获得一个国家/地区的 map : layout = dict( title = '',
plotly - Plotly 的默认色标是什么？
关于 this page暗示他们有一些默认的色标，例如“Viridis”。我终其一生都找不到一个网页来记录这些命名的色标是什么。最佳答案问题是我是英国人并且正确拼写了颜色。色标可在 https:/
r - 如何在 plotly 中为子 plotly 中的所有 plotly 强制使用相同的颜色？
在下面的示例中，我在一个 plotly 子图中有四个箱形图。此示例中的四个箱形图中的每一个都有 3 个变量:股票、债券和现金。在每个箱线图中，我希望股票以相同的颜色(例如蓝色)显示，债券以相同的颜色(
javascript - plotly:删除 plot 并在同一个 div 中创建一个新的 plot
我有一个 plotly plot，当数据发生变化时，我想删除 plot 并生成一个新 plot。为此，我这样做: $('#heatmap2').empty() 然后我重新生成我的 plotly 。但是
python - Plotly:如何使用 plotly.graph_objects 和 plotly.express 在图形中定义颜色？
有许多问题和答案以一种或另一种方式涉及这个主题。有了这个贡献，我想清楚地说明为什么一个简单的方法，比如 marker = {'color' : 'red'}将适用于 plotly.graph_obje
python - 为什么 matplotlib .plot(kind ='bar' ) plot 与 .plot() 如此不同
这可能是一个非常愚蠢的问题，但是当使用 .plot() 绘制 Pandas DataFrame 时，它非常快并且会生成具有适当索引的图形。一旦我尝试将其更改为条形图，它似乎就失去了所有格式并且索引
python - plotly dash - 使用 plotly 生成图像，在本地保护它并使用 plotly dash 显示它
我用 plotly (express) 生成了很多图像，并将它们以 png 格式保存在本地目录中。我想创建一个带有 plotly dash 的仪表板。我生成的图像有很多依赖关系:这就是我不想将代码包含
python - 交互式 plotly 的 plotly 表达与Altair/Vega-Lite的 plotly 比较
最近，我正在学习Plotly express和Altair/Vega-Lite进行交互式绘图。他们两个都令人印象深刻，我想知道他们的优点和缺点是什么。尤其是对于创建交互式地块，它们之间有什么大差异，何
plotly:从直方图中获取值/plotly:从轨迹中获取值
在 plotly 中，我可以创建一个直方图，例如in this example code from the documentation : import plotly.express as px df
plot - Julia plot 函数数组问题
来自 Matlab 我正在努力弄清楚为什么以下不起作用: plot(x=rand(10),y=rand(10)) 正确生成图表。 x=rand(10) y=rand(10) plot(x,y) 产生错
plot - 自定义图例标签 - geopandas.plot()
我和一位同事一直在尝试设置自定义图例标签，但到目前为止都失败了。下面的代码和详细信息 - 非常感谢任何想法! 笔记本:toy example uploaded here 目标:将图例中使用的默认比率值
plotly - 如何使用 Plotly 控制哪些跟踪图位于顶部？
我正在使用 Plotly python 库生成一个带有几个 fiddle 图和几个填充散点图的图形。无论什么订单我都有个人fig.add_trace在我的代码中调用， fiddle 图总是在散点图后面
plot - 删除 Plotly 中图表之间的差距
我将图表的大小配置为 Shiny 但图表之间仍有空白区域它们在配置高度和宽度之前显示为旧区域这是我的代码 plot1_reactive % layout(xaxis = xaxis,
plotly - 如何组织一个有 plotly 的破折号项目？
我想弄清楚如何组织一个包含多个应用程序的破折号项目。所有示例都是单页应用程序，我希望将多个破折号组织为一个项目，由 gunicorn 运行(在 docker 容器内): dash-project/
Julia Plotly 不显示带有子图的 plotly
我之前做了一些解决方法来在 Julia Plotly 中实现精彩的子图，但目前正在努力解决一个更复杂的问题。下面有三种方法可以完成这项工作。 draw1 完美地完成了，但不适用于我的情况，draw2
plotly - 删除 Plotly 中子图之间的空间？
我的子图之间有很大的空间。在 matplotlib 中，有一种称为紧密布局的布局可以消除这种情况。 plotly 有没有类似的布局？我正在 iPython 笔记本中绘图，因此空间有限。请参阅下图中的空
plotly - plot.ly 热图色标不起作用
我正在尝试获取我提前生成的 cbrewer Reds 颜色图。但是，当我尝试使用它时，我仍然得到一些默认的颜色图。我究竟做错了什么？这是 plotly :https://plot.ly/~smirno
plotly - Plot.ly - 图例中同一键的多条轨迹
我一直在使用 plot.ly 并希望将多个跟踪分组到图例中的同一个键。我有显示有关特定用户的数据的子图。我想让每个键代表一个用户，而不是 user.data1、user.data2 等。这是我现在
plot - 如何从 Plotly 中删除轴和数字
我有下面这张图，我想把除点和三角形以外的所有东西都去掉，意思是横纵轴上的数字和小竖线，我该怎么做？这是图片: 这是我的代码: x0 = np.average(triangleEdges,axis=0

首页

博学

6Ren·AI

商城

python - Plotly:从 csv 中按年份绘制用户输入的词频