- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
请您告知以下几行如何应该根据重写 http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
df.drop('PACKETS', axis=1, inplace=True)
产生
See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
df.drop('PACKETS', axis=1, inplace=True)
/home/app/ip-spotlight/code/app/ipacc/plugin/ix.py:74: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame
df.replace(numpy.nan, "", inplace=True)
产生
See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
df.replace(numpy.nan, "", inplace=True)
/home/app/ip-spotlight/code/app/ipacc/plugin/ix.py:68: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame
另一方面,下面是如何根据上述原理重写的示例
df.loc[:, ('SRC_PREFIX')] = df[ ['SRC_NET', 'SRC_MASK'] ].apply(lambda x: "/".join(x), axis=1)
但是我不知道如何重写案例 1 和 2?
编辑:到目前为止的代码看起来像这样(df
是感兴趣的数据帧)。所以最初是某种类型的类型转换:
df = pandas.DataFrame(data['payload'], columns=sorted(data['header'], key=data['header'].get))
df = df.astype({
'SRC_AS' : "object",
'DST_AS' : "object",
'COMMS' : "object",
'SRC_COMMS' : "object",
'AS_PATH' : "object",
'SRC_AS_PATH' : "object",
'PREF' : "object",
'SRC_PREF' : "object",
'MED' : "object",
'SRC_MED' : "object",
'PEER_SRC_AS' : "object",
'PEER_DST_AS' : "object",
'PEER_SRC_IP' : "object",
'PEER_DST_IP' : "object",
'IN_IFACE' : "object",
'OUT_IFACE' : "object",
'SRC_NET' : "object",
'DST_NET' : "object",
'SRC_MASK' : "object",
'DST_MASK' : "object",
'PROTOCOL' : "object",
'TOS' : "object",
'SAMPLING_RATE' : "uint64",
'EXPORT_PROTO_VERSION' : "object",
'PACKETS' : "object",
'BYTES' : "uint64",
})
然后调用模块的calculate
函数:
mod.calculate(data['identifier'], data['timestamp'], df)
calculate
函数的定义如下:
def calculate(identifier, timestamp, df):
try:
# Filter based on AORTA IX.
lut_ipaddr = lookup_ipaddr()
df = df[ (df.PEER_SRC_IP.isin( lut_ipaddr )) ]
if df.shape[0] > 0:
logger.info('analyzing message `{}`'.format(identifier))
# Preparing for input.
df.replace("", numpy.nan, inplace=True)
# Data wrangling. Calculate traffic rate. Reduce.
df.loc[:, ('BPS')] = 8*df['BYTES']*df['SAMPLING_RATE']/300
df.drop(columns=['SAMPLING_RATE', 'EXPORT_PROTO_VERSION', 'PACKETS', 'BYTES'], inplace=True)
# Data wrangling. Formulate prefixes using CIDR notation. Reduce.
df.loc[:, ('SRC_PREFIX')] = df[ ['SRC_NET', 'SRC_MASK'] ].apply(lambda x: "/".join(x), axis=1)
df.loc[:, ('DST_PREFIX')] = df[ ['DST_NET', 'DST_MASK'] ].apply(lambda x: "/".join(x), axis=1)
df.drop(columns=['SRC_NET', 'SRC_MASK', 'DST_NET' ,'DST_MASK'], inplace=True)
# Populate using lookup tables.
df.loc[:, ('NETELEMENT')] = df['PEER_SRC_IP'].apply(lookup_netelement)
df.loc[:, ('IN_IFNAME')] = df.apply(lambda x: lookup_iface(x['NETELEMENT'], x['IN_IFACE']), axis=1)
df.loc[:, ('OUT_IFNAME')] = df.apply(lambda x: lookup_iface(x['NETELEMENT'], x['OUT_IFACE']), axis=1)
# df.loc[:, ('SRC_ASNAME')] = df.apply(lambda x: lookup_asn(x['SRC_AS']), axis=1)
# Add a timestamp.
df.loc[:, ('METERED_ON')] = arrow.get(timestamp, "YYYYMMDDHHmm").format("YYYY-MM-DD HH:mm:ss")
# Preparing for input.
df.replace(numpy.nan, "", inplace=True)
# Finalize !
return identifier, timestamp, df.to_dict(orient="records")
else:
logger.info('going through message `{}` no IX bgp/netflow data were found'.format(identifier))
except Exception as e:
logger.error('processing message `{}` at `{}` caused `{}`'.format(identifier,timestamp,repr(e)), exc_info=True)
return identifier, timestamp, None
最佳答案
好的。我真的不知道 Pandas 背后到底发生了什么。但我仍然尝试举出一些最小的示例来向您展示问题可能出在哪里以及您可以采取哪些措施。首先,创建数据框:
import numpy as np
import pandas as pd
df = pd.DataFrame(dict(x=[0, 1, 2],
y=[0, 0, 5]))
然后,当您将数据帧传递给函数时,我将执行相同的操作,但对于两个几乎相同的函数:
def func(dfx):
# Analog of your df = df[df.PEER_SRC_IP.isin(lut_ipaddr)]
dfx = dfx[dfx['x'] > 1.5]
# Analog of your df.replace("", numpy.nan, inplace=True)
dfx.replace(5, np.nan, inplace=True)
def func_with_copy(dfx):
dfx = dfx[dfx['x'] > 1.5].copy() # explicitly making a copy
dfx.replace(5, np.nan, inplace=True)
现在让我们称它们为初始 df:
func_with_copy(df)
print(df)
给出
x y
0 0 0
1 1 0
2 2 5
并且没有警告。并称之为:
func(df)
print(df)
给出相同的输出:
x y
0 0 0
1 1 0
2 2 5
但有警告:
/usr/local/lib/python3.6/site-packages/ipykernel_launcher.py:6: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame
See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
所以这看起来像是“误报”。这是关于误报的一个很好的评论:link
这里奇怪的是,如果您对数据帧执行完全相同的操作但没有将其传递给函数,那么您将不会看到此警告。 ́\_(ツ)_/́
我的建议是使用.copy()
关于 python Pandas : A value is trying to be set on a copy of a slice from a DataFrame,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47207713/
我正在尝试使用 flot 绘制 SQL 数据库中的数据图表,这是使用 php 收集的,然后使用 json 编码的。 目前看起来像: [{"month":"February","data":482},
我有一个来自 php 行的 json 结果,类似于 ["value"]["value"] 我尝试使用内爆函数,但得到的结果是“value”“value” |id_kategori|created_at
脚本 1 将记录 two 但浏览器仍会将 select 元素呈现为 One。该表单还将提交值 one。 脚本 2 将记录、呈现和提交 两个。我希望它们是同义词并做同样的事情。请解释它们为何不同,以及我
我的python字典结构是这样的: ips[host][ip] 每行 ips[host][ip] 看起来像这样: [host, ip, network, mask, broadcast, mac, g
在 C# 中 我正在关注的一本书对设置和获取属性提出了这样的建议: double pri_test; public double Test { get { return pri_test; }
您可能熟悉 enum 位掩码方案,例如: enum Flags { FLAG1 = 0x1, FLAG2 = 0x2, FLAG3 = 0x4, FLAG4 = 0x8
在一些地方我看到了(String)value。在一些地方value.toString() 这两者有什么区别,在什么情况下我需要使用哪一个。 new Long(value) 和 (Long)value
有没有什么时候 var result = !value ? null : value[0]; 不会等同于 var result = value ? value[0] : null; 最佳答案 在此处将
我正在使用扫描仪检测设备。目前,我的条形码的值为 2345345 A1。因此,当我扫描到记事本或文本编辑器时,输出将类似于 2345345 A1,这是正确的条形码值。 问题是: 当我第一次将条形码扫描
我正在读取 C# 中的资源文件并将其转换为 JSON 字符串格式。现在我想将该 JSON 字符串的值转换为键。 例子, [ { "key": "CreateAccount", "text":
我有以下问题: 我有一个数据框,最多可能有 600 万行左右。此数据框中的一列包含某些 ID。 ID NaN NaN D1 D1 D1 NaN D1 D1 NaN NaN NaN NaN D2 NaN
import java.util.*; import java.lang.*; class Main { public static void main (String[] args) thr
我目前正在开发我的应用程序,使其设计基于 Holo 主题。在全局范围内我想做的是工作,但我对文件夹 values、values-v11 和 values-v14. 所以我知道: values 的目标是
我遇到了一个非常奇怪的问题。 我的公司为我们的各种 Assets 使用集中式用户注册网络服务。我们一般通过HttpURLConnection使用请求方法GET向Web服务发送请求,通过qs设置参数。这
查询: UPDATE nominees SET votes = ( SELECT votes FROM nominees WHERE ID =1 ) +1 错误: You can't specify
如果我运行一段代码: obj = {}; obj['number'] = 1; obj['expressionS'] = 'Sin(0.5 * c1)'; obj['c
我正在为我的应用创建一个带有 Twitter 帐户的登录页面。当我构建我的项目时会发生上述错误。 values/strings.xml @dimen/abc_text_size_medium
我在搜索引擎中使用以下 View : CREATE VIEW msr_joined_view AS SELECT table1.id AS msr_id, table1.msr_number, tab
为什么验证会返回此错误。如何解决? ul#navigation li#navigation-3 a.current Value Error : background-position Too
我有一个数据名如下 import pandas as pd d = { 'Name' : ['James', 'John', 'Peter', 'Thomas', 'Jacob', 'Andr
我是一名优秀的程序员,十分优秀!