java - 提高基于斯坦福标注器的程序的性能-6ren

java - 提高基于斯坦福标注器的程序的性能

转载作者：塔克拉玛干更新时间：2023-11-03 03:48:48

24

4

我刚刚在 Java 中实现了一个使用斯坦福词性标注器的程序。

我使用了一个几 KB 大小的输入文件，由几百个单词组成。我什至将堆大小设置为 600 MB。

但它仍然很慢，有时会用完堆内存。我怎样才能提高它的执行速度和内存性能？我希望能够使用几 MB 作为输入。

  public static void postag(String args) throws ClassNotFoundException

  {

     try

     {

     File filein=new File("c://input.txt");

     String content = FileUtils.readFileToString(filein);

     MaxentTagger tagger = new MaxentTagger("postagging/wsj-0-18-bidirectional-distsim.tagger");

     String tagged = tagger.tagString(content);

        try 
        {
            File file = new File("c://output.txt");
            if (!file.exists()) 
            {
                file.createNewFile();
            } 

            FileWriter fw = new FileWriter(file.getAbsoluteFile());
            BufferedWriter bw = new BufferedWriter(fw);
            bw.write("\n"+tagged);
            bw.close();

            }
              catch (IOException e) 
              {
                    e.printStackTrace();
               }

     } catch (IOException e1)
     {
         e1.printStackTrace();
     }

 }

最佳答案

主要的第一条建议是使用 wsj-0-18-left3words-distsim.tagger(或者可能更好，english-left3words-distsim.tagger 在最近的版本中，用于一般文本)，而不是 wsj-0-18-bidirectional-distsim.tagger。虽然双向标记器的标记性能略微更好，但它的速度要慢大约 6 倍，并且使用大约两倍的内存。图 FWIW:在 2012 MacBook Pro 上，当提供足够的文本来“预热”时，left3words 标记器将以每秒大约 35000 个单词的速度标记文本。

关于内存使用的另一条建议是，如果您有大量文本，请确保以合理大小的 block 将其传递给 tagString()，而不是全部作为一个巨大的字符串，因为整个字符串将被立即标记化，增加了内存需求。

关于java - 提高基于斯坦福标注器的程序的性能，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15727144/

24

4

0

文章推荐： algorithm - 如何解决 SPOJ 上的 BAISED？

文章推荐： java - FreeMarker:使用宏时保持标识

文章推荐： algorithm - 递归关系的中间步骤 T(n) = 2T(n/2)+ n/log(n)

文章推荐： java - JSoup 解析带有未闭合标签的无效 HTML

swift - MKPolyline 标注
我有一条短线 (MKPolyline) 和一个自定义注释类 (MKPointAnnotaion)。现在我的点注释位于多段线的中点。但是，我希望每当触摸多段线上的任何点时都显示标注，类似于路由在 map
iphone - 取消自定义 MKAnnotationView 标注
我正在使用此自定义 MKAnnotationView http://blog.asolutions.com/2010/09/building-custom-map-annotation-callout
iphone - 自定义 MKAnnotationView 标注
这个问题已经有答案了: 已关闭11 年前。 Possible Duplicates: Custom MKPinAnnotation callout bubble similar to default
iphone - 自动显示 MKAnnotation 标注
为什么这不起作用？ - (void)mapView:(MKMapView *)mapView didAddAnnotationViews:(NSArray *)views { if (TRAC
iphone - 如何隐藏 MKAnnotationView 标注？
我试图在不触摸引脚的情况下隐藏 AnnotationView，这可能吗？谢谢! for (id currentAnnotation in self.mapView.annotations) {
javascript - 标注 JQplot 饼图
我正在使用 JQplot 饼图。我需要标 checkout 现在图表之外。我怎样才能做到这一点？最佳答案如果您指的是数据标签，则需要将 dataLabelPositionFactor 设置为大于
ios - 根据所选注释对各个页面进行 Mapkit 标注
我的 map 上有 20 个图钉，点击后每个图钉都会显示带有 field 名称的注释，并且右侧有一个标注按钮。我已使用 segue 成功将此按钮链接到单个页面。问题是所有位置都链接到同一页面。我想要
android - 标注 MapView Android
是否可以像在 iPhone 和 Google map 中那样将标注附加到 ItemizedOverlay 项目？最佳答案我假设“标注”是指通常出现的信息窗口/“气球提示”？这是代码和示例: htt
python - 实现 PySide 标注
我正在使用 Python 2.7 和 PySide(Qt 包装器)开发 GUI 应用程序。我希望标注小部件 float 在其他小部件上方(类似于工具提示)，但不使用标准工具提示框架，该框架基本上为小
ios - 集群时显示 MKAnnotation 标注
我有一个 TableView，用于在点击单元格时显示 MapView 注释标注。在 iOS 10 中，我可以将 MapView 置于注释的中心，然后使用以下方法显示它的标注: func tableV
iphone - 自定义 MKAnnotationView 标注
我想创建一个自定义 MKAnnotationView 标注，如此图所示。我已经测试了几种解决方案，但它们只允许自定义左/右图像和标题/副标题。谁能给我一些源代码或教程链接吗？目前我一无所知。请帮忙。
iphone - iOS6 不显示 MKAnnotationView 标注
我一直在寻找可能是这个问题的根源，但我看不出出了什么问题。我希望你能在这里帮助我。我正在尝试在 mapView 中显示注释，图钉被丢弃但无法看到标注，直到我先点击用户位置注释(蓝点)然后返回并点击注
java - 工作簿和 Oracle B2B 标注
我需要将 xml 数据转换为 Excel 文件。当我写入文件时，我的代码可以正常工作，但是，当我尝试写入输出流时，代码无法正常工作。我想做的就是使用 Apache POI 类创建一个 excel 文
iphone - 如何始终显示 map View 标注？
如何始终在 map View 中显示标注？如果我们点击 map View 标注隐藏并再次点击图钉显示。我不想这样......，我需要始终显示标注，没有隐藏。这个怎么做。请帮我。我正在使用下面的代码来显
ios - 自定义 MKAnnotation 标注 View ？
我有一个MKPointAnnotation: let ann = MKPointAnnotation() self.ann.coordinate = annLoc self.ann.title = "
ios - 在平移/缩放上移动的 Mapbox 标注。
我已遵循指南here创建自定义标注 View 。我在自定义类中添加了两行: var dismissesAutomatically: Bool = false var isAnchoredToAnnot
javascript - 以 Angular 实现交互式弹出窗口/标注
我们正在 Angular.js 中做一个项目，我们从用户体验人员那里获得的模型大量使用交互式弹出窗口/标注。问题是我似乎无法以干净的方式将这些映射到 Angular 概念上。从概念上讲，它们需要自己
ios - map 标注 showCallout-iOS
我在显示注释标题时遇到问题，如下图所示。第一张图片很好地表示了值(value)；另一方面，一旦值上升到三位数，标题就会显示三个点，如第二张图片所示。我想知道如何解决这个问题。任何想法都将非常受欢迎!非
ruby - NLP对句子的内容进行分类/标注(需要Ruby绑定(bind))
我正在分析几百万封电子邮件。我的目标是能够分类然后分组。组可以是例如: 交付问题(交付缓慢、发货前处理缓慢、可用性信息不正确等) 客户服务问题(电子邮件回复速度慢、回复不礼貌等) 返回问题(返回请求处
ios - 自定义 MKAnnotation 标注 View ？
我有一个MKPointAnnotation: let ann = MKPointAnnotation() self.ann.coordinate = annLoc self.ann.title = "

首页

博学

6Ren·AI

商城

java - 提高基于斯坦福标注器的程序的性能