- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
让我们首先构建一个ctable
:
import pandas as pd
import blaze as bl
df = pd.DataFrame({'x': range(4), 'y': [2., 4., 2., 4.]})
bl.odo(df, 'test.bcolz')
现在假设我想在这个表中添加一个名为“x_mod”的列。我试过了
test_table = bl.Data('test.bcolz')
def f(h):
return h*3
test_table['x_mod'] = test_table['x'].apply(f, dshape='int64')
#Or, I think equivalently:
#test_table['x_mod'] = test_table['x']*3
但是它给了
TypeError: 'InteractiveSymbol' object does not support item assignment
1) 如何分配 'x_mod' 列然后保存到磁盘?我正在处理大型数据库:计算内存中的列应该没问题,但我无法将整个 ctable
加载到内存中。
2) 在相关问题上,apply
对我也不起作用。我做错了什么吗?
#This doesn't work:
bl.compute(test_table['x'].apply(f, dshape='int64'))
#This I think should be equivalent, but does work:
bl.compute(test_table['x']*3)
感谢您的宝贵时间!
最佳答案
您可以像这样在 Blaze 中使用转换方法:
bz.transform(df, sepal_ratio = df.sepal_length / df.sepal_width )
其他函数需要使用Blaze表达式:
bz.transform(df, sepal_ratio = BLAZE_symbolic_Expression(df.Col1, df.col2) )
它将计算列添加到数据框中。文档在这里: https://blaze.readthedocs.io/en/latest/expressions.html
例如,您可以使用 map :
from datetime import datetime
yourexpr = df.col1.map(datetime.utcfromtimestamp)
bz.transform(df, sepal_ratio=yourexpr)
关于python - 使用 Blaze 追加 bcolz 列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31547384/
我有一个包含约 7M 行和 3 列的数据集,其中 2 个数字和 1 个由约 20M 不同字符串 uuid 组成。数据作为 csv 文件需要大约 3G,castra 可以将其存储在大约 2G 中。我想用
我正在玩这个 notebook 中的内存压缩示例中的 bcolz 到目前为止,我对这个库感到非常惊讶。我认为它对于我们所有人来说都是一个很好的工具,可以将更大的文件加载到较小的内存中(Francesc
我在 Conda 环境中的 Jupyter Notebook 中工作。 我已经通过三种不同的方式安装了 bcolz,但我的笔记本页面上总是出现以下屏幕截图。 当我在环境中输入“Python”或“Pyt
让我们首先构建一个ctable: import pandas as pd import blaze as bl df = pd.DataFrame({'x': range(4), 'y': [2.,
dask 文档指出:“BColz 是一个磁盘上、分块、压缩的列存储。这些属性使其对 dask.dataframe 非常有吸引力,它可以在其上运行得特别好。有一个特殊的 from_bcolz 函数。”
我想使用 bcolz 将 pandas 数据框保存到文件。 我试过: import bcolz import pandas as pd df = pd.read_csv(open("mydata.cs
我正在尝试在 mac os 的虚拟环境中安装 zipline。 Python 版本 = 3.6/numpy,预装 cython 当我在虚拟环境中尝试 pip install zipline 时,出现以
我正在尝试在 mac os 的虚拟环境中安装 zipline。 Python 版本 = 3.6/numpy,预装 cython 当我在虚拟环境中尝试 pip install zipline 时,出现以
所以我目前在 Windows 7 上运行,并且正在尝试运行一些 jupyter notebook。我使用 Python 2.7.13 和 Anaconda。我做了“pip install bcolz”
我是一名优秀的程序员,十分优秀!