gpt4 book ai didi

java - 在django框架中使用java代码

转载 作者:行者123 更新时间:2023-11-30 03:00:30 27 4
gpt4 key购买 nike

好的,我有一个使用 Django 框架设计的简单界面,它接受用户的自然语言输入并将其存储在表中。

此外,我还有一个使用 cTAKES 库使用 Java 构建的管道来进行命名实体识别,即它将获取用户提交的文本输入并使用相关的 UMLS 标签对其进行注释。

我想要做的是获取用户给出的输入,然后提交一次,将其引导到我的 java-cTAKES 管道中,然后将带注释的输出反馈回数据库中。

我对网络开发方面还很陌生,并且在这个意义上找不到任何关于集成脚本的内容。因此,如果有人能给我指出有用的资源或大致正确的方向,那将非常有帮助。

==========================更新:

好吧,所以我发现子进程是我想在这种情况下使用的模块,并且我尝试根据文档实现一些简单的代码,但我得到了

Exception Type: OSError
Exception Value: [Errno 2] No such file or directory
Exception Location: /System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/subprocess.py in _execute_child, line 1335.

简要概述我正在尝试做的事情:

这是我在 View 中的代码。其目的是从模型表单中获取文本输入,将其 POST 到数据库,然后将该输入传递到我的脚本中,该脚本会生成一个 XML 文件,该文件存储在数据库的另一列中。我对 django 很陌生,所以如果这是一个简单的修复,我很抱歉,但我找不到任何与 django 和子进程相关的有用文档。

def queries_create(request):
if not request.user.is_authenticated():
return render(request, 'login_error.html')


form = QueryForm(request.POST or None)
if form.is_valid():
instance = form.save(commit=False)
instance.save()
p=subprocess.Popen([request.POST['post'], './path/to/run_pipeline.sh'])
p.save()

context = {

"title":"Create",
"form": form,

}
return render(request, "query_form.html", context)

模型代码片段:

class Query(models.Model):
problem/intervention = models.TextField()

updated = models.DateTimeField(auto_now=True, auto_now_add=False)
timestamp = models.DateTimeField(auto_now=False, auto_now_add=True)

更新2:好的,通过更改子流程代码,代码不再被破坏,如下所示

def queries_create(request):
if not request.user.is_authenticated():
return render(request, 'login_error.html')


form = QueryForm(request.POST or None)
if form.is_valid():
instance = form.save(commit=False)
instance.save()
p = subprocess.Popen(['path/to/run_pipeline.sh'], stdin=subprocess.PIPE,
stdout=subprocess.PIPE)
(stdoutdata, stderrdata) = p.communicate()
instance.processed_data = stdoutdata
instance.save()

context = {

"title":"Create",
"form": form,

}
return render(request, "query_form.html", context)

但是,我现在收到“无法找到或加载主类管道。CtakesPipeline”,我不明白,因为脚本在此工作目录中的 shell 中运行良好。这是我尝试使用子进程调用的脚本。

#!/bin/bash

INPUT=$1
OUTPUT=$2
CTAKES_HOME="full/path/to/CtakesClinicalPipeline/apache-ctakes-3.2.2"
UMLS_USER="####"
UMLS_PASS="####"
CLINICAL_PIPELINE_JAR="full/path/to/CtakesClinicalPipeline/target/
CtakesClinicalPipeline-0.0.1-SNAPSHOT.jar"

[[ $CTAKES_HOME == "" ]] && CTAKES_HOME=/usr/local/apache-ctakes-3.2.2

CTAKES_JARS=""
for jar in $(find ${CTAKES_HOME}/lib -iname "*.jar" -type f)
do
CTAKES_JARS+=$jar
CTAKES_JARS+=":"
done

current_dir=$PWD
cd $CTAKES_HOME

java -Dctakes.umlsuser=${UMLS_USER} -Dctakes.umlspw=${UMLS_PASS} -cp
${CTAKES_HOME}/desc/:${CTAKES_HOME}/resources/:${CTAKES_JARS%?}:
${current_dir}/${CLINICAL_PIPELINE_JAR} -
-Dlog4j.configuration=file:${CTAKES_HOME}/config/log4j.xml -Xms512M -Xmx3g
pipeline.CtakesPipeline $INPUT $OUTPUT

cd $current_dir

我不确定如何修复此错误,因此感谢您的帮助。

最佳答案

如果我理解正确的话,您希望将 request.POST['post'] 的值通过管道传输到程序 run_pipeline.sh 并将输出存储在实例的字段中。

  1. 您错误地调用了 subprocess.Popen。应该是:

    p = subprocess.Popen(['/path/to/run_pipeline.sh'], stdin=subprocess.PIPE, stdout=subprocess.PIPE)

  2. 然后传入输入并读取输出

    (stdoutdata, stderrdata) = p.communicate()

  3. 然后保存数据,例如在您的实例的字段中

    instance.processed_data = stdoutdata
    实例.save()

我建议您首先确保调用在 Python shell 中工作的子进程,然后将其集成到您的 Django 应用程序中。

请注意,在请求中创建(可能长时间运行的)子流程确实是一种不好的做法,并且可能会导致很多问题。最佳实践是在作业队列中委派长时间运行的任务。对于 Django,Celery可能是最常用的。不过,涉及一些设置。

关于java - 在django框架中使用java代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36133242/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com