- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我为外语学习者构建了一个 Drupal Ed 站点,该站点具有词汇共享功能和抽认卡功能。我正在考虑添加一种方法来解析文本(报纸文章等)并输出使用的单词列表,然后可能交叉连接到词汇部分。
现在,我想知道是否有理想的 php 或 python 中的任何程序/脚本可用于将文本解析为使用的单词列表(并且可能能够排除最常用单词的列表).我希望能够适应在 Drupal 中工作,所以 php 最好。我愿意使用那里的各种东西吗?有什么想法吗?
我什至不确定从哪里开始?
最佳答案
简单的开始:
<?php
// source text
$paragraph = "Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Proin congue, quam nec tincidunt congue, massa ipsum sodales tellus,
in rhoncus sem quam quis ante. Nam condimentum pellentesque libero at
blandit. Suspendisse felis sem, interdum pulvinar ultricies a, auctor
vel leo. Curabitur congue mi nec purus placerat sit amet mollis magna
laoreet. Duis eu purus non turpis lacinia sagittis. Aliquam tristique
nulla volutpat neque posuere faucibus. Aenean tempus diam quis sem
convallis id cursus lorem sagittis. Nam feugiat, felis nec tincidunt
aliquet, felis lectus bibendum mi, ut tincidunt purus urna ac felis.
Quisque ut lectus dolor. Duis ipsum arcu, adipiscing id vestibulum
fringilla, euismod non augue. Nullam quis ipsum nec tortor tristique
egestas sed nec leo. Pellentesque tempus velit lacus, sit amet rhoncus
mi. Curabitur justo ipsum, consectetur ac vestibulum sed, porttitor
eget dui. Vivamus nisi lorem, porta vel gravida quis, varius et elit.
Nulla eros metus, congue sit amet interdum at, porta eget ligula.";
// remove newlines
$paragraph = str_replace(array("\r","\n"), '', $paragraph);
// convert to lowercase
$paragraph = strtolower($paragraph);
// remove non-alphanumeric characters
$paragraph = preg_replace('/[^A-Za-z0-9\s]/', '', $paragraph);
// convert into array
$words = explode(' ', $paragraph);
// remove null values
$words = array_filter($words, 'strlen');
// remove duplicate values
$words = array_unique($words);
// sort array alphabetically (optional)
natsort($words);
// reindex array
$words = array_values($words);
// display array
print_r($words);
?>
更新:现在删除换行符。将所有修改分成单独的命令。
关于php - 用 PHP/Python 解析文本?如何?什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5504128/
我在 JavaScript 文件中运行 PHP,例如...... var = '';). 我需要使用 JavaScript 来扫描字符串中的 PHP 定界符(打开和关闭 PHP 的 )。 我已经知道使
我希望能够做这样的事情: php --determine-oldest-supported-php-version test.php 并得到这个输出: 7.2 也就是说,php 二进制检查 test.
我正在开发一个目前不使用任何框架的大型 php 站点。我的大问题是,随着时间的推移慢慢尝试将框架融入应用程序是否可取,例如在创建的新部件和更新的旧部件中? 比如所有的页面都是直接通过url服务的,有几
下面是我的源代码,我想在同一页面顶部的另一个 php 脚本中使用位于底部 php 脚本的变量 $r1。我需要一个简单的解决方案来解决这个问题。我想在代码中存在的更新查询中使用该变量。 $name)
我正在制作一个网站,根据不同的情况进行大量 PHP 重定向。就像这样...... header("Location: somesite.com/redirectedpage.php"); 为了安全起见
我有一个旧网站,我的 php 标签从 因为短标签已经显示出安全问题,并且在未来的版本中将不被支持。 关于php - 如何避免在 php 文件中写入
我有一个用 PHP 编写的配置文件,如下所示, 所以我想用PHP开发一个接口(interface),它可以编辑文件值,如$WEBPATH , $ACCOUNTPATH和 const值(value)观
我试图制作一个登录页面来学习基本的PHP,首先我希望我的独立PHP文件存储HTML文件的输入(带有表单),但是当我按下按钮时(触发POST到PHP脚本) )我一直收到令人不愉快的错误。 我已经搜索了S
我正在寻找一种让 PHP 以一种形式打印任意数组的方法,我可以将该数组作为赋值包含在我的(测试)代码中。 print_r 产生例如: Array ( [0] => qsr-part:1285 [1]
这个问题已经有答案了: 已关闭11 年前。 Possible Duplicate: What is the max key size for an array in PHP? 正如标题所说,我想知道
我正在寻找一种让 PHP 以一种形式打印任意数组的方法,我可以将该数组作为赋值包含在我的(测试)代码中。 print_r 产生例如: Array ( [0] => qsr-part:1285 [1]
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
我在 MySQL 数据库中有一个表,其中存储餐厅在每个工作日和时段提供的菜单。 表结构如下: i_type i_name i_cost i_day i_start i_
我有两页。 test1.php 和 test2.php。 我想做的就是在 test1.php 上点击提交,并将 test2.php 显示在 div 中。这实际上工作正常,但我需要向 test2.php
我得到了这个代码。我想通过textarea更新mysql。我在textarea中回显我的MySQL,但我不知道如何更新它,我应该把所有东西都放进去吗,因为_GET模式没有给我任何东西,我也尝试_GET
首先,我是 php 的新手,所以我仍在努力学习。我在 Wordpress 上创建了一个表单,我想将值插入一个表(data_test 表,我已经管理了),然后从 data_test 表中获取所有列(id
我有以下函数可以清理用户或网址的输入: function SanitizeString($var) { $var=stripslashes($var); $va
我有一个 html 页面,它使用 php 文件查询数据库,然后让用户登录,否则拒绝访问。我遇到的问题是它只是重定向到 php 文件的 url,并且从不对发生的事情提供反馈。这是我第一次使用 html、
我有一个页面充满了指向 pdf 的链接,我想跟踪哪些链接被单击。我以为我可以做如下的事情,但遇到了问题: query($sql); if($result){
我正在使用 从外部文本文件加载 HTML/PHP 代码 $f = fopen($filename, "r"); while ($line = fgets($f, 4096)) { print $l
我是一名优秀的程序员,十分优秀!