gpt4 book ai didi

java - 学习 JBoss 流口水 : what should be my model

转载 作者:行者123 更新时间:2023-12-04 06:49:37 25 4
gpt4 key购买 nike

我在学习JBoss Drools我正在使用来自 hapmap 项目的遗传学数据:( http://hapmap.ncbi.nlm.nih.gov/genotypes/latest/forward/non-redundant/ )。此目录中的每个文件都是一个带有 的表。个人在顶部,职位 在左侧的基因组上,观察到的 突变 对于每个人/职位。

在这里,我想使用 Drools 查找文件中的一些潜在错误(例如, child 没有 parent 的任何突变)。

1)我想在 Drools 中加载这些数据。这可能是大量数据(例如 genotypes_chr2_YRI_r27_nr.b36_fwd.txt.gz 是 20Mo gzipped )这些数据会存储在内存中吗?还是 Drools 将其存储在某个地方?还是我应该使用持久性系统?

2)关于型号:

我正在考虑将以下类放在 StatefulKnowledgeSession 中:

class Individual
{
private String name;
//constructor, getters, setters etc...
}

class Position
{
private String name;
private String chromosome;
private int position;
//constructor, getters, setters etc...
}

class ObservedMutation
{
private String individualName;
private String positionName;
private String observed;
//constructor, getters, setters etc...
}

或者 ObservedMutation 应该是:
class ObservedMutation
{
private Individual individual;
private Position position;
private String observed;
//constructor, getters, setters etc...
}

谢谢你的建议

皮埃尔

更新 :我的第一次测试: http://plindenbaum.blogspot.com/2010/07/rules-engine-for-bioinformatics-playing.html

最佳答案

是的,当你插入大量数据时,Drools 会将它们存储在内存中。 20 Mb 可能不是问题 - 试试吧。

为您建议的模型类编写规则应该很简单——第一次测试中 hapmap.drl 示例中的规则看起来很合理。您的两个 ObservedMutation 类之间的选择与其他任何事情一样多是品味问题,因为它们将导致不同的 DRL 规则语法。我会从第二个版本开始,看看你是怎么做的:如果你有对象属性(如在 ObservedMutation 的第二个版本中),也许不明显的事情是你可能需要使用 this引用绑定(bind)的对象,例如$p在:

when
ObservedMutation($p : position)
Position(this == $p)

关于java - 学习 JBoss 流口水 : what should be my model,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3313153/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com