- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个使用 pandas_profiling 的简单 Python 程序。这是源代码,我将其存储为 c:\temp\pandas_profiling_demo.py:
import pandas as pd
import pandas_profiling as pp
df = pd.DataFrame(data={'x': [1, 2, 3, 4, 5], 'y': [2, 2, 4, 6, 6], 'z': [4, 6, 1, 5, 2]})
print(df.head(10))
profile = pp.ProfileReport(df)
profile.to_file(outputfile="C:\\temp\\pandas_profiling_demo.html")
print("Done.")
我还有一个启动 Python 程序的 Java 程序(这不是真正的程序,它涉及 GUI,但这会重现问题。)我的程序在 Eclipse 中,但我将在此处复制它:
package pandasprofilingbug;
import java.io.File;
import java.lang.ProcessBuilder.Redirect;
import java.nio.file.Files;
import java.util.Map;
public class PandasProfilingBug {
public static void main(String[] args)
{
String[] command = new String[] { "cmd", "/C", "python", "c:\\temp\\pandas_profiling_demo.py" } ;
ProcessBuilder pb = new ProcessBuilder(command);
Map<String, String> env = pb.environment();
env.remove("PYSPARK_DRIVER_PYTHON"); // else attempts to open in notebook environment
Process p = null;
try
{
File log = new File("c:\\temp\\pandas_profiling_demo.log");
Files.deleteIfExists(log.toPath());
pb.redirectErrorStream(true);
pb.redirectOutput(Redirect.to(log));
// System.out.print("Start...");
p = pb.start();
assert pb.redirectInput() == Redirect.PIPE;
assert pb.redirectOutput().file() == log;
assert p.getInputStream().read() == -1;
// TODO: How to give user an option to cancel???
// TODO: How to provide progress report?
System.out.print("Waiting...");
p.waitFor();
System.out.print("waiting over...exitValue = " + p.exitValue());
}
catch (Exception ie)
{
System.err.println(ie);
ie.printStackTrace();
}
}
当我运行 Java 程序时,它陷入了循环。这是重复输出的第一个 block :
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 105, in spawn_main
exitcode = _main(fd)
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 114, in _main
prepare(preparation_data)
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 225, in prepare
_fixup_main_from_path(data['init_main_from_path'])
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 277, in _fixup_main_from_path
run_name="__mp_main__")
File "C:\Users\bill_\Anaconda3\lib\runpy.py", line 263, in run_path
pkg_name=pkg_name, script_name=fname)
File "C:\Users\bill_\Anaconda3\lib\runpy.py", line 96, in _run_module_code
mod_name, mod_spec, pkg_name, script_name)
File "C:\Users\bill_\Anaconda3\lib\runpy.py", line 85, in _run_code
exec(code, run_globals)
File "c:\temp\pandas_profiling_demo.py", line 21, in <module>
profile = pp.ProfileReport(df)
File "C:\Users\bill_\Anaconda3\lib\site-packages\pandas_profiling\__init__.py", line 66, in __init__
description_set = describe(df, **kwargs)
File "C:\Users\bill_\Anaconda3\lib\site-packages\pandas_profiling\describe.py", line 349, in describe
pool = multiprocessing.Pool(pool_size)
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\context.py", line 119, in Pool
context=self.get_context())
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\pool.py", line 174, in __init__
self._repopulate_pool()
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\pool.py", line 239, in _repopulate_pool
w.start()
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\process.py", line 105, in start
self._popen = self._Popen(self)
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\context.py", line 322, in _Popen
return Popen(process_obj)
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\popen_spawn_win32.py", line 33, in __init__
prep_data = spawn.get_preparation_data(process_obj._name)
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 143, in get_preparation_data
_check_not_importing_main()
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 136, in _check_not_importing_main
is not going to be frozen to produce an executable.''')
RuntimeError:
An attempt has been made to start a new process before the
current process has finished its bootstrapping phase.
This probably means that you are not using fork to start your
child processes and you have forgotten to use the proper idiom
in the main module:
if __name__ == '__main__':
freeze_support()
...
The "freeze_support()" line can be omitted if the program
is not going to be frozen to produce an executable.
x y z
0 1 2 4
1 2 2 6
2 3 4 1
3 4 6 5
4 5 6 2
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 105, in spawn_main
exitcode = _main(fd)
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 114, in _main
prepare(preparation_data)
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 225, in prepare
_fixup_main_from_path(data['init_main_from_path'])
File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 277, in _fixup_main_from_path
run_name="__mp_main__")
# REPEATED AD NAUSEUM
当我在 Jupyter 笔记本中运行 Python 程序时,它工作正常,创建了所需的 html 文件。
当我注释掉这些行时,从 Java 调用时它工作正常(显示数据帧):
#profile = pp.ProfileReport(df)
#profile.to_file(outputfile="C:\\temp\\pandas_profiling_demo.html")
由于如果不使用分析,我可以从 Java 运行该程序,因此我怀疑 pandas_profiling 有问题(或者至少对我来说有问题)。为什么它会导致程序进入循环?
提前致谢。
最佳答案
就您而言:
import pandas as pd
import pandas_profiling as pp
if __name__ == "__main__":
df = pd.DataFrame(data={'x': [1, 2, 3, 4, 5], 'y': [2, 2, 4, 6, 6], 'z': [4, 6, 1, 5, 2]})
print(df.head(10))
profile = pp.ProfileReport(df)
profile.to_file(outputfile="C:\\temp\\pandas_profiling_demo.html")
print("Done.")
关于java - 从 Java 程序启动时,Pandas 分析不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56648504/
每当我运行命令以将 Virtualbox 驱动程序启动 Minishift 到操作系统主机时,它都需要一段疯狂的时间,而且它永远不会结束。有时我什至收到有关达到存储限制的错误消息。 不知道是不是描述h
您好,我正在使用 npm 运行一个基本的 React 项目,我正尝试在 docker 容器中启动它。但是我实际上无法让项目运行。我的 dockerfile 看起来像这样: FROM node:7.8.
所以我想从我的 SSH 终端开始游戏。 这真的很奇怪,当我直接从 Linux GUI 执行此操作时,它可以工作。但是当我使用 SSH 客户端进行远程连接时,它就崩溃了。似乎与我的显示驱动程序有关。 U
我有一个显示图像的动态壁纸。我在 Activity 中更改了该图像。然后我需要通知动态壁纸,以便它知道重新加载资源。 Intent 似乎是完美、简单的解决方案: Intent intent = new
我有一个似乎无法解决的问题。我在 Boot Dashboard 中使用 STS 3.9.2 从 Eclipse (Oxygen) 启动 Spring Boot 应用程序没有任何问题: 但是,当我尝试从
全新的 Python,在我开始摆弄东西之前先设置和安装东西。我的理解是 Python 2.7 和 Python 3.3 之间存在一些显着差异/不兼容,尽管这两个版本都得到了很好的使用,所以我认为最好安
在使用了很长时间的 jQuery 之后,我有一个问题,我正在使用 jQuery 模式(样式)编写一个简单的代码, (function(window, undefined) { var jQu
我正在尝试在 spring boot 应用程序下的非 spring 托管类中配置 Autowired。我在 tomcat 服务器下部署的 Web 应用程序下成功运行了这个。但是当我想在 spring
我对 xmonad 完全陌生,但我想开始使用它来提高我的工作效率。 这是我一直在使用的指南(我使用的是 Apple OS X Snow Leopard) http://xmonad.org/tour.
我试图将Spring Boot指南中的Managing Transactions示例扩展到两个数据源,但是@Transaction注释似乎仅对其中一个数据源有效。 在“Application.java
conEmu 有没有办法默认打开多个不同的选项卡? 我看到这个页面解释了如何使用 splits , 我意识到我可以按 Ctrl + T, 1, Enter,但我希望有一种方法可以自动执行此操作! "%
我正在寻找快速而肮脏的答案。我当时脑子一片空白,盯着屏幕看了 12 个小时以上,我想我中枪了。 我想做一个简单的 SignalR 应用程序作为教程。我找到了这个example ,但我不断收到票证未定义
我正在使用 Azure Powershell cmdlet 来启动/停止 VM。 Start-AzureVM [-ServiceName] [-Name] [ ] Stop-AzureVM [-S
我想使用Powershell脚本代码启动/停止iis和mssql 意味着当我运行ps脚本时,我想启动/停止iis和mssql 我在网上搜索了它,发现了一些代码,但按照我的要求无法正常工作 码: $ii
我在 liferay 工作。我们在我们的项目中使用一个模块来创建 liferay 主题。我使用命令 ant -Ddeploy.war=true 将它部署在服务器中。 war 文件在 liferay 部
我想在已安装 Python 2.7 的 Windows XP 计算机上运行 IPython(版本 0.12)。 我通过 Windows 二进制安装程序安装,但安装后 IPython 没有显示在菜单中,
我从创建了自己的简单图片。 FROM python:2.7.11 RUN mkdir /extra/later/ \ && mkdir /yyy 现在,我可以执行以下步骤: docker run
$(document).ready(function () { setTimeout(function() { window.location.reload(); }, 2000); // 2
我刚刚创建了一个帐户 OpenWeatherMap 我想通过城市 ID API 调用获取当前位置的天气: http://api.openweathermap.org/data/2.5/weather?
我注意到,如果我更改 xcasset 中的图像,启动 Storyboard不会更新。 例如,假设您的启动 Storyboard中有一个 UIImage View ,其中包含一个名为“logo”的蓝色图
我是一名优秀的程序员,十分优秀!