- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章如何利用Python实现一个论文降重工具由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
时值毕业季,有不少小伙伴深受论文查重的困扰。因此我便想到做一个简单的自动去重的工具,先看看效果,我们再对原理或是代码实现做进一步的分析.
首先需要输入appid以及key,这些可以在百度翻译开放平台申请一个账号,可以免费申请一个账号。接着将需要进行降重的文本内容复制到相应的输入框内,点击开始按钮,即可输出不同但意思相近的语句,即达到降重去重的作用。点击复制按钮便可以将得到的新文本复制到剪贴板上,点击清楚按钮可以重新输入需要降重的文本,并且循环往复地进行.
论文查重的粒度是句子,两个句子的相似度主要取决于句子包含哪些词,以及词在句子中的位置。句子相似度只是文字上的对比,不考虑语义上的相近.
正因如此,我们可以采取的措施便是变换句子结构,使用近似词替换.
为了完成这些句子的自动替换,从而达到降重的目的,这里很容易便想到利用不同语种之间的互相转换来生成新文本。比如在本工具中,我采用了中文→英文→韩文→中文的策略,你也可以采取更长的转换路径,但那样似乎会在很大程度上降低文本的可读性.
语句的翻译我采用了百度翻译开放平台的接口,简单地申请之后就可以获取每个月200万的免费字符翻译权限.
此api的接入方式略微有些麻烦,需要生成签名sign并且拼接完整的url.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
def
translate(q,lan_from,lan_to):
url
=
'http://api.fanyi.baidu.com/api/trans/vip/translate'
salt
=
random.randint(
1
,
65536
)
sign
=
hashlib.md5((
str
(appid)
+
str
(q)
+
str
(salt)
+
str
(key)).encode(
'utf-8'
)).hexdigest()
params
=
{
'from'
:lan_from,
'to'
:lan_to,
'salt'
: salt,
'sign'
: sign,
'appid'
: appid,
'q'
: q
}
r
=
requests.get(url,params
=
params)
txt
=
r.json()
if
txt.get(
'trans_result'
,
-
1
)
=
=
-
1
:
print
(
'error code:{}'
.
format
(txt))
return
q
return
txt[
'trans_result'
][
0
][
'dst'
]
|
在弄清楚原理以及api的调用方法之后,我们可以轻松地写出一个gui界面,也就是这个降重工具。当然这个工具非常初级,大家可以进行更加全面的扩展.
到此这篇关于如何利用python实现一个论文降重工具的文章就介绍到这了,更多相关python论文降重工具内容请搜索我以前的文章或继续浏览下面的相关文章希望大家以后多多支持我! 。
原文链接:https://blog.csdn.net/lyc44813418/article/details/105872915 。
最后此篇关于如何利用Python实现一个论文降重工具的文章就讲到这里了,如果你想了解更多关于如何利用Python实现一个论文降重工具的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我是一名优秀的程序员,十分优秀!