php - 使用 PHP(或查询)在 MySQL 数据库中使用超过数千行的常用词-6ren

php - 使用 PHP(或查询)在 MySQL 数据库中使用超过数千行的常用词

转载作者：太空宇宙更新时间：2023-11-03 12:20:48

25

4

我有一个包含大量记录的 MySQL 数据库。对于每条记录，都有一个名为“评论”的文本字段，我在下面放了 3 个示例:

我的问题是:

我如何查询每条记录，查看“评论”字段的内容，然后计算出使用的前 20 个词是什么？

例如使用单词上方的 3 条评论

我猜我需要使用 PHP 来处理每条记录，使用“”(空格)展开，删除逗号和句号等字符，然后存储结果并计算这些记录。

但我真的不确定最好的方法，也不确定如何处理复数形式，例如“谢谢”和“谢谢”。因此问题:)

马特

最佳答案

因为它们都在一列中，所以您实际上不能在这里进行太多 SQL 过滤。

如果数据集不是太大(即 php 耗尽大量内存)，那么您应该能够将其读入 php 并进行处理。

您可以使用 explode 在空间上进行拆分并将数据作为一个巨大的数组来处理。您可以使用 preg_match 函数进行字符串比较操作，请参阅:http://us3.php.net/preg_match - 您应该花一些时间研究正则表达式。

如果你正在寻找像 SELECT COUNT(comment) where comment like '%thank%' 这样的特定内容，那么在 where 子句中使用 SQL like 函数会更容易，但你会手动执行此操作。

此外，您可能需要考虑将其转储到一个文件中并使用基于 unix 的命令，如 wc，这可以帮助您完成您所追求的。如果您处于类 unix 环境中，也可以使用 PHP 与这些命令进行交互。

除了编写代码之外，我无法告诉您更多信息。

关于php - 使用 PHP(或查询)在 MySQL 数据库中使用超过数千行的常用词，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20163619/

25

4

0

javascript - Javascript 常用词
我想从字符串中获取常用单词。我发现了这个方法: http://jsbin.com/nufimudivu/1/edit for(var i = 0; i } } http://jsbin.co
c++ - 使用 unordered_map 方法在 C++ 中查找最(多个)常用词
从文本输入中找出最常见的词，不包括给定词的列表。如果有多个最大字数，则全部显示。我的方法是 21/24 个测试用例，我似乎想不出我遗漏的 3 个测试用例。我正在添加我现在拥有的代码，这对我来说是高