- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我在我的项目中实现了实验环境。
该组件基于 Scikit learn。
在此组件中,我将给定的 CSV 读入 pandas 数据帧。之后,我选择了最佳特征并将给定数据帧的维度从 100 减少到 5。之后,我将删除的 ID 列添加到这个简化的数据框中以供将来使用。该列在降维过程中被删除。
一切正常,直到我更改代码以读取所有 CSV 文件并返回一个联合数据帧:
请看下面的代码:读取所有 CSV:
dataframes = []
from os import listdir
from os.path import isfile, join
files_names = [f for f in listdir(full_path_directory_files) if isfile(join(full_path_directory_files, f))]
for file_name in files_names:
full_path_file = full_path_directory_files + file_name
data_frame = pd.read_csv(full_path_file, index_col=None, compression="infer")
dataframes.append(dataframe)
之后我在数据帧之间进行了串联
features_dataframe = pd.concat(dataframes, axis=0)
我也查了一下。我创建了两个不同的数据框,形状 = (200, 100)连接后变成 (400, 100)
之后数据帧被发送到以下方法:
def _reduce_dimensions_by_num_of_features(self, features_dataframe, truth_dataframe, num_of_features):
print("Create dataframe with the {0} best features".format(num_of_features))
## In those functions I got the ids and their class
ids, id_series = self._create_ids_by_dataframe(features_dataframe)
features_dataframe_truth_class = self._extract_truth_class_by_truth_dataframe(truth_dataframe, ids)
k_best_classifier = SelectKBest(score_func=f_classif, k=num_of_features)
k_best_features = k_best_classifier.fit_transform(features_dataframe, features_dataframe_truth_class)
reduced_dataframe_column_names = self._get_k_best_feature_names(k_best_classifier, features_dataframe)
reduced_dataframe = pd.DataFrame(k_best_features, columns=reduced_dataframe_column_names)
现在我检索了 ID 列:
reduced_dataframe["Id"] = id_series
软件在消息上失败:
ValueError: cannot reindex from a duplicate axis
这仅在数据帧连接之后发生。
如何将 ID 列添加到数据框中而不出现错误?
最佳答案
我发现了问题:
连接数据帧后,索引发生更改,当我们添加行时:
reduced_dataframe["Id"] = id_series
我们遇到错误。
解决方案是重置索引:
features_dataframe = pd.concat(dataframes, axis=0)
features_dataframe.reset_index(drop=True, inplace=True)
关于python - 错误值Error : cannot reindex from a duplicate axis because of concatenating dataframes,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39975957/
我正在使用 HighCharts 线图,其中我的 x Axis 数据分布不均匀: [4, 10, 40, 100, 400, 1000, etc.] 目前,x 值均匀放置。我希望 x[5] 和 x[4
这是我使用的程序: library(plotly) mydata = read.csv("data_to_plot.txt") df = as.data.frame(mydata) p % gro
我一直在试图找到2之间的差异,但是要减去这个就没有运气了 The primary diff erence between the two representations is that a quate
给定一个没有 Axis 的图,我想使用 axis 添加一个水平 Axis 。在左侧,您会看到给定的“基线”图,在右侧,您会看到所需的结果: 基线图是使用简单生成的 plot(1, axes = FAL
我正在创建 XYPlot,并且需要反转 y Axis 上的顺序(也就是说,我需要较低的数字来使 Axis 上的数字较高)。如果有任何关于如何做到这一点的提示,我将不胜感激。 最佳答案 我也遇到了和你一
我有一个包含两个系列的图表,每个系列都有自己的yAxis。我需要自动将第二个轴最大值设置为第一个轴最大值的 13.5%。例如,如果第一个轴从 0 到 100,那么我希望第二个轴从 0 到 13.5(无
在 google 图表数据表对象中,我可以使用 datatable.getValue(...) 获取当前选择点值(V 轴/Y 轴)。但是,如果我想从 X 轴获取时间/日期/年份(请参见屏幕截图)。我没
我想知道是否有可能(我知道是)将绘图的 Axis 标签保留在绘图的一侧,将绘图的 Axis 标题保留在另一侧,特别是在离散的 geom_tile() 绘图中,如下所示: 最佳答案 您可以在 scale
我正在尝试制作带有自定义 Axis 标签的箱线图,但我似乎无法向图中添加 x Axis 。 例如: test <- data.frame(year=as.integer(rep(1963:2014,
我正在使用 LightningChartJS 创建图表。单击图例框中的系列描述后,系列消失,但 Axis 保留。是否可以将 Axis 与系列一起隐藏? 我的 Axis 和系列如下:- const ax
我有一个关于如何获取另一个 Axis 服务中已部署的 Axis 服务列表的问题。这是场景。我使用 Tomcat 7.0.14 和 Axis 2-1.5.5 作为部署环境。假设目前 Tomcat 上部署
我目前正在尝试使用包含两个 y Axis (一个在左边,一个在右边)的 AChartEngine 创建一个图表。然而,我似乎无法弄清楚如何才能真正添加第二个 y Axis 。一个 XYMultip
我正在使用 Core Plot 库在 iOS 上绘制图形。我想在 yAxis 的网格线之间添加颜色。我已经设法通过设置轴的 alternatingBandFills 属性来做到这一点。但是,我也必须在
我想知道是否有办法改变 x 轴刻度和 y 轴刻度背景的背景颜色以及字体颜色。 例如在 example in this link ,您可以看到代码的 x 轴(0,2,4,5..)和 y 轴(12,10,
我部署在 Weblogic 集群上的 Java 应用程序调用了如下两个 Web 服务。 • 它通过 HTTPS 向互联网上的外部应用程序发送 SOAP 客户端请求。(通过 Axis 1.4 创建的 J
我正在尝试为 x 和 y 设置 Axis ,但每次尝试时,热图都会缩小到绘图的一角。我试试 plt.xlim(0, 60) plt.ylim(0, 30) 我也试过: ax.set_ylim(0, 3
使用 DC js,尝试将 rowChart 设置为固定 X Axis 为 0-100。但是将其绘制为一条线? 我设置了 .elasticX(false) 并且看起来像上面那样。设置为 true 看起来
我有一些法语等级的学生成绩数据(双值,范围从 0 到 20)。 目前,在允许将日期作为 X 轴的散点图(用线连接点)上,我的 Y 轴上的成绩是双倍的,而 X 轴上是一系列学期结束日期。 使用以下间隔映
我正在尝试制作一个极坐标“sypder”图,但我在 Axis 标签方面遇到了一些问题。 xaxis 刻度标签似乎总是在 y Axis 网格下方的层上结束(字母被网格线覆盖,如下图所示),我希望它们在顶
我正在尝试使用ggplot2包绘制以下图形,但是以某种方式不会显示轴。刻度线在那里,而不仅仅是轴线。我使用了theme(axis.line=element_line())函数,但无法正常工作。 这是我
我是一名优秀的程序员,十分优秀!