java - 从 Java 程序启动时，Pandas 分析不起作用-6ren

java - 从 Java 程序启动时，Pandas 分析不起作用

转载作者：行者123 更新时间：2023-11-30 05:35:50

25

4

我有一个使用 pandas_profiling 的简单 Python 程序。这是源代码，我将其存储为 c:\temp\pandas_profiling_demo.py:

import pandas as pd
import pandas_profiling as pp
df = pd.DataFrame(data={'x': [1, 2, 3, 4, 5], 'y': [2, 2, 4, 6, 6], 'z': [4, 6, 1, 5, 2]})
print(df.head(10))
profile = pp.ProfileReport(df)
profile.to_file(outputfile="C:\\temp\\pandas_profiling_demo.html")
print("Done.")

我还有一个启动 Python 程序的 Java 程序(这不是真正的程序，它涉及 GUI，但这会重现问题。)我的程序在 Eclipse 中，但我将在此处复制它:

package pandasprofilingbug;

import java.io.File;
import java.lang.ProcessBuilder.Redirect;
import java.nio.file.Files;
import java.util.Map;

public class PandasProfilingBug {

    public static void main(String[] args) 
    {
        String[] command = new String[] { "cmd", "/C", "python", "c:\\temp\\pandas_profiling_demo.py" } ;
        ProcessBuilder pb = new ProcessBuilder(command);
        Map<String, String> env = pb.environment();

        env.remove("PYSPARK_DRIVER_PYTHON");        // else attempts to open in notebook environment    

        Process p = null;

        try
        {
            File log = new File("c:\\temp\\pandas_profiling_demo.log");
            Files.deleteIfExists(log.toPath());

            pb.redirectErrorStream(true);
            pb.redirectOutput(Redirect.to(log));
            // System.out.print("Start...");
            p = pb.start();
            assert pb.redirectInput() == Redirect.PIPE;
            assert pb.redirectOutput().file() == log;
            assert p.getInputStream().read() == -1;

            // TODO: How to give user an option to cancel???
            // TODO: How to provide progress report?
            System.out.print("Waiting...");
            p.waitFor();
            System.out.print("waiting over...exitValue = " + p.exitValue());
        }
        catch (Exception ie)
        {
            System.err.println(ie);
            ie.printStackTrace();
        }

    }

当我运行 Java 程序时，它陷入了循环。这是重复输出的第一个 block :

Traceback (most recent call last):
  File "<string>", line 1, in <module>
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 105, in spawn_main
    exitcode = _main(fd)
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 114, in _main
    prepare(preparation_data)
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 225, in prepare
    _fixup_main_from_path(data['init_main_from_path'])
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 277, in _fixup_main_from_path
    run_name="__mp_main__")
  File "C:\Users\bill_\Anaconda3\lib\runpy.py", line 263, in run_path
    pkg_name=pkg_name, script_name=fname)
  File "C:\Users\bill_\Anaconda3\lib\runpy.py", line 96, in _run_module_code
    mod_name, mod_spec, pkg_name, script_name)
  File "C:\Users\bill_\Anaconda3\lib\runpy.py", line 85, in _run_code
    exec(code, run_globals)
  File "c:\temp\pandas_profiling_demo.py", line 21, in <module>
    profile = pp.ProfileReport(df)
  File "C:\Users\bill_\Anaconda3\lib\site-packages\pandas_profiling\__init__.py", line 66, in __init__
    description_set = describe(df, **kwargs)
  File "C:\Users\bill_\Anaconda3\lib\site-packages\pandas_profiling\describe.py", line 349, in describe
    pool = multiprocessing.Pool(pool_size)
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\context.py", line 119, in Pool
    context=self.get_context())
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\pool.py", line 174, in __init__
    self._repopulate_pool()
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\pool.py", line 239, in _repopulate_pool
    w.start()
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\process.py", line 105, in start
    self._popen = self._Popen(self)
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\context.py", line 322, in _Popen
    return Popen(process_obj)
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\popen_spawn_win32.py", line 33, in __init__
    prep_data = spawn.get_preparation_data(process_obj._name)
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 143, in get_preparation_data
    _check_not_importing_main()
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 136, in _check_not_importing_main
    is not going to be frozen to produce an executable.''')
RuntimeError: 
        An attempt has been made to start a new process before the
        current process has finished its bootstrapping phase.

        This probably means that you are not using fork to start your
        child processes and you have forgotten to use the proper idiom
        in the main module:

            if __name__ == '__main__':
                freeze_support()
                ...

        The "freeze_support()" line can be omitted if the program
        is not going to be frozen to produce an executable.
   x  y  z
0  1  2  4
1  2  2  6
2  3  4  1
3  4  6  5
4  5  6  2
Traceback (most recent call last):
  File "<string>", line 1, in <module>
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 105, in spawn_main
    exitcode = _main(fd)
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 114, in _main
    prepare(preparation_data)
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 225, in prepare
    _fixup_main_from_path(data['init_main_from_path'])
  File "C:\Users\bill_\Anaconda3\lib\multiprocessing\spawn.py", line 277, in _fixup_main_from_path
    run_name="__mp_main__")

# REPEATED AD NAUSEUM

当我在 Jupyter 笔记本中运行 Python 程序时，它工作正常，创建了所需的 html 文件。

当我注释掉这些行时，从 Java 调用时它工作正常(显示数据帧):

    #profile = pp.ProfileReport(df)
    #profile.to_file(outputfile="C:\\temp\\pandas_profiling_demo.html")

由于如果不使用分析，我可以从 Java 运行该程序，因此我怀疑 pandas_profiling 有问题(或者至少对我来说有问题)。为什么它会导致程序进入循环？

提前致谢。

最佳答案

您可以找到解决方案here和 here .

就您而言:

import pandas as pd
import pandas_profiling as pp

if __name__ == "__main__":
    df = pd.DataFrame(data={'x': [1, 2, 3, 4, 5], 'y': [2, 2, 4, 6, 6], 'z': [4, 6, 1, 5, 2]})
    print(df.head(10))
    profile = pp.ProfileReport(df)
    profile.to_file(outputfile="C:\\temp\\pandas_profiling_demo.html")
    print("Done.")

关于java - 从 Java 程序启动时，Pandas 分析不起作用，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56648504/

25

4

0

文章推荐： c++ - 加载 Rcpp 模块

文章推荐： javascript - 在 QML 中使用对话框

文章推荐： c++ - 密码字段中显示的额外字母

文章推荐： javascript - 使用 D3js 循环遍历一组图像

out-of-memory - 启动 minishift 或占用大量内存时，启动 OpenShift 集群永远不会结束
每当我运行命令以将 Virtualbox 驱动程序启动 Minishift 到操作系统主机时，它都需要一段疯狂的时间，而且它永远不会结束。有时我什至收到有关达到存储限制的错误消息。不知道是不是描述h
node.js - 使用 docker 启动 npm 启动？
您好，我正在使用 npm 运行一个基本的 React 项目，我正尝试在 docker 容器中启动它。但是我实际上无法让项目运行。我的 dockerfile 看起来像这样: FROM node:7.8.
linux - 无法从 SSH 启动 MonoGame，但可以从 GUI 启动
所以我想从我的 SSH 终端开始游戏。这真的很奇怪，当我直接从 Linux GUI 执行此操作时，它可以工作。但是当我使用 SSH 客户端进行远程连接时，它就崩溃了。似乎与我的显示驱动程序有关。 U
android - 从 WallpaperService 启动 Intent 或向 WallpaperService 启动 Intent
我有一个显示图像的动态壁纸。我在 Activity 中更改了该图像。然后我需要通知动态壁纸，以便它知道重新加载资源。 Intent 似乎是完美、简单的解决方案: Intent intent = new
java - 可以从 Eclipse (STS) 启动 Spring Boot，但不能从 CLI 启动
我有一个似乎无法解决的问题。我在 Boot Dashboard 中使用 STS 3.9.2 从 Eclipse (Oxygen) 启动 Spring Boot 应用程序没有任何问题: 但是，当我尝试从
python - 在 CMD "python"启动 Python 3.3， "py"启动 Python 2.7，我该如何更改？
全新的 Python，在我开始摆弄东西之前先设置和安装东西。我的理解是 Python 2.7 和 Python 3.3 之间存在一些显着差异/不兼容，尽管这两个版本都得到了很好的使用，所以我认为最好安
jQuery 启动
在使用了很长时间的 jQuery 之后，我有一个问题，我正在使用 jQuery 模式(样式)编写一个简单的代码， (function(window, undefined) { var jQu
Spring 启动@Configurable
我正在尝试在 spring boot 应用程序下的非 spring 托管类中配置 Autowired。我在 tomcat 服务器下部署的 Web 应用程序下成功运行了这个。但是当我想在 spring
haskell - 启动 xmonad
我对 xmonad 完全陌生，但我想开始使用它来提高我的工作效率。这是我一直在使用的指南(我使用的是 Apple OS X Snow Leopard) http://xmonad.org/tour.
Spring 启动-管理交易和多个数据源
我试图将Spring Boot指南中的Managing Transactions示例扩展到两个数据源，但是@Transaction注释似乎仅对其中一个数据源有效。在“Application.java
Conemu 启动，任务打开多个选项卡
conEmu 有没有办法默认打开多个不同的选项卡？我看到这个页面解释了如何使用 splits , 我意识到我可以按 Ctrl + T, 1, Enter，但我希望有一种方法可以自动执行此操作! "%
jquery - SignalR - 启动
我正在寻找快速而肮脏的答案。我当时脑子一片空白，盯着屏幕看了 12 个小时以上，我想我中枪了。我想做一个简单的 SignalR 应用程序作为教程。我找到了这个example ，但我不断收到票证未定义
powershell - 启动/停止特定订阅下的所有虚拟机
我正在使用 Azure Powershell cmdlet 来启动/停止 VM。 Start-AzureVM [-ServiceName] [-Name] [ ] Stop-AzureVM [-S
iis - 启动/停止iis和mssql的powershell脚本代码
我想使用Powershell脚本代码启动/停止iis和mssql 意味着当我运行ps脚本时，我想启动/停止iis和mssql 我在网上搜索了它，发现了一些代码，但按照我的要求无法正常工作码: $ii
liferay - 启动 liferay
我在 liferay 工作。我们在我们的项目中使用一个模块来创建 liferay 主题。我使用命令 ant -Ddeploy.war=true 将它部署在服务器中。 war 文件在 liferay 部
ipython - 启动 IPython
我想在已安装 Python 2.7 的 Windows XP 计算机上运行 IPython(版本 0.12)。我通过 Windows 二进制安装程序安装，但安装后 IPython 没有显示在菜单中，
docker - 启动+卷挂载后在docker容器内自动运行命令
我从创建了自己的简单图片。 FROM python:2.7.11 RUN mkdir /extra/later/ \ && mkdir /yyy 现在，我可以执行以下步骤: docker run
javascript - 启动/停止脚本以刷新页面
$(document).ready(function () { setTimeout(function() { window.location.reload(); }, 2000); // 2
javascript - OpenWeatherMap 启动
我刚刚创建了一个帐户 OpenWeatherMap 我想通过城市 ID API 调用获取当前位置的天气: http://api.openweathermap.org/data/2.5/weather?
ios - 启动 Storyboard中的图像未更新
我注意到，如果我更改 xcasset 中的图像，启动 Storyboard不会更新。例如，假设您的启动 Storyboard中有一个 UIImage View ，其中包含一个名为“logo”的蓝色图

首页

博学

6Ren·AI

商城

java - 从 Java 程序启动时，Pandas 分析不起作用