java - 使用二叉树跟踪词频-6ren

java - 使用二叉树跟踪词频

转载作者：行者123 更新时间：2023-11-29 08:07:38

25

4

我目前正在学习二叉树和二叉搜索树，我正在进行的练习之一涉及读取文本文件、按字母顺序将每个单词存储在二叉树中，以及使用不同的方法遍历树。以下是具体规范:

Read in the text and build a binary search tree comprising of all the words in the text (based alphabetically), store the word and keep a count of the word's frequency (the number of times each word appears in the text) in a node, and perform tree traversals mentioned in class.

我的问题是，当我将某个词添加到树中时，如何跟踪该词的出现频率？我们从来没有在类里面讨论过相同的节点，所以我被困在这里。任何建议表示赞赏!

最佳答案

简单。二叉树节点将由两个元素组成，一个是字符串(比如键)，另一个是整数计数(比如值)。添加元素时检查它是否已经存在，如果是，则简单地增加计数，否则将元素添加为计数为 1 的新二叉树节点。

关于java - 使用二叉树跟踪词频，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10066581/

25

4

0

Java - 词频
我在 Eclipse 中创建了一个 Java 程序。该程序计算每个单词的频率。例如，如果用户输入“I went to the shop”，程序将产生输出“1 1 1 2”，即 1 个字长 1 ('I'
r - R 中的文本分析 - 词频
我在工作中只有 R 可用，而且我以前用 Python 做过。我需要获取 CSV 文件中每组事件的计数。我在 Python 中进行了情绪分析，我在提供的表格中搜索了一本 Python 字典，其中包含每个
c++ - 词频 strcmp 使用结构数组无限工作
我想一个字一个字地读，然后将哪个字与我的结构数组中的字进行比较。如果我没有，我想在第一个空位添加。 #include #include #include #include using names
python - 使用文本搭配计算 ngram 词频
我想计算已转换为标记的文本文件中特定单词前后三个单词的频率。 from nltk.tokenize import sent_tokenize from nltk.tokenize import wor
java - 词频 - HashMap 或 TreeMap
我需要编写一个程序来计算文本中每个单词的频率，此外我需要能够返回 n 个最常用单词的列表(如果更多单词具有相同的频率(它们按字母顺序排序)。还有一个未计算在内的单词列表(停用词)。停用词使用什么结构
python - sklearn 的 TfidfVectorizer 词频？
我对 sklearn 的 TfidfVectorizer 在计算每个文档中单词的频率时有一个疑问。我看到的示例代码是: >>> from sklearn.feature_extraction.tex

首页

博学

6Ren·AI

商城

java - 使用二叉树跟踪词频