- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在使用 Google App Engine 和 Python 开发一个网站。我希望在网站上添加一个功能,用户可以在其中输入一个单词,系统将根据该单词(基于用法)给出最接近的匹配单词/句子作为对用户的建议。现在我已经实现了一个基于 Peter Norvig 方法拼写检查算法的算法。但我觉得从长远来看,这不是一个非常可扩展的解决方案。我正在寻找在 Google App Engine 上实现此类功能的建议方法。预测 Api 是可行的方法吗?或者编写我自己的算法是最好的方法?如果编写我自己的算法是一种方式,任何人都可以给我一些关于如何使解决方案稳健的指示吗?
代码片段:
import re, collections
from bp_includes.models import User, SocialUser
from bp_includes.lib.basehandler import BaseHandler
from google.appengine.ext import ndb
import utils.ndb_json as ndb_json
class TextPredictionHandler(BaseHandler):
alphabet_list = 'abcdefghijklmnopqrstuvwxyz' #list of alphabets
#Creates corpus with frequency/probability distribution
def trainForText(self,features):
search_dict = collections.defaultdict(lambda: 1)
for f in features:
search_dict[f] += 1
return search_dict
#Heart of the code. Decides how many words can be formed by modifying a given word by one letter
def edit_dist_one(self,word):
splits = [(word[:i],word[i:]) for i in range(len(word) + 1)]
deletes = [a + b[1:] for a,b in splits if b]
transposes = [a + b[1] + b[0] + b[2:] for a,b in splits if (len(b) > 1)]
replaces = [a + c + b[1:] for a, b in splits for c in self.alphabet_list if b]
inserts = [a + c + b for a, b in splits for c in self.alphabet_list]
return set(deletes + transposes + replaces + inserts)
#Checks for exact matches in Corpus for words
def existing_words(self,words,trainSet):
return set(w for w in words if w in trainSet)
#Checks for partial matches in Corpus for a word.
def partial_words(self,word,trainSet):
regex = re.compile(".*("+word+").*")
return set(str(m.group(0)) for l in trainSet for m in [regex.search(l)] if m)
def found_words(self,word):
word = word.lower()
data = []
q = models.SampleModel.query() #This line will not work as I had to mask out the model I am using
#Really bad way of making a Corpus. Needs to modified to be scalable. So many loops. Corpus can be stored in google cloud storage to reduce processing time.
for upost in q.fetch():
if upost.text!="":
tempTextData = re.sub("[^\w]", " ", upost.text).split()
for t in range(len(tempTextData)):
data.append(tempTextData[t].lower())
# data.append(upost.text.lower())
if upost.definition!="":
tempData = re.sub("[^\w]", " ", upost.definition).split()
for t in range(len(tempData)):
data.append(tempData[t].lower())
if upost.TextPhrases:
for e in upost.TextPhrases:
for p in e.get().phrases:
data.append(p.lower())
if upost.Tags:
for h in upost.Tags:
if h.get().text.replace("#","")!="" :
data.append(h.get().text.replace("#","").lower())
trainSet = self.trainForText(data)
set_of_words = self.existing_words([word],trainSet).union(self.existing_words(self.edit_dist_one(word),trainSet))
set_of_words = set_of_words.union(self.partial_words(word,trainSet))
set_of_words = set_of_words.union([word])
return set_of_words
def get(self, search_text):
outputData = self.found_words(search_text)
data = {"texts":[]}
for dat in outputData:
pdata = {}
pdata["text"] = dat;
data["texts"].append(pdata)
self.response.out.write(ndb_json.dumps(data))
最佳答案
与自己制作相比,使用 Prediction API 是最可靠和可扩展的。无需重新发明轮子。
如果您要编写自己的代码,这可能是一个漫长的复杂过程,并且道路上有很多颠簸,除非您对学习和编写该系统有浓厚的兴趣,否则我建议您使用现有工具。
这是一个 example来自谷歌自己。
这是 documentation for the Prediction API .
Hello World program与预测 API。
关于python - 在 Google App Engine 中使用 python 进行文本预测的建议解决方案是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31815857/
Google Cloud Compute 中的 Google Compute Engine、App Engine 和 Container Engine 之间的实际区别是什么?什么时候使用什么? 有什么
我有一个在 Google App Engine 中运行的应用程序,它访问在 Google Compute Engine 中的机器上运行的服务。 Google App Engine 应用程序是该服务唯一
我们正在谷歌云中构建一个应用程序。我们使用 App Engine 作为前端,使用 Compute Engine 作为后端。在这些 Compute Engine 实例上,我正在运行一个接受特定“命令”消
我有一个现有的 GAE 应用程序(我们称之为应用程序 A)正在运行的情况,但由于非技术原因无法修改。当用户迁移到新的客户端版本时,我们需要将他们的数据从应用程序 A 迁移到新的 GAE 应用程序(我称
我正在尝试发现 App Engine 上的其他已部署服务。类似于 this文章建议。 我的代码是这样的: import ( "fmt" "net/http" "google.g
我想在我的网站上为“图像处理”事件设置服务器。如果我在 GCE 中使用“n1-standard-1”实例,GAE 中的可比功率是多少?是因为我算错了,还是同一个功率两者价格相差很大? 最佳答案 按小时
我在 Googl Compute Engine 和 Google App Engine 标准环境中的应用程序中创建了一个 VM 实例。我打算在 App Engine 中使用我的应用程序,在 Compu
我像往常一样使用 appcfg.py 更新我的应用程序,但收到一条错误消息。我试过 appcfg.py 回滚,两次尝试之间等了十分钟,但我仍然收到相同的错误消息。我该怎么办? 无法对 apps/dev
我想在 Google Compute Engine 上放置一个 Redis 服务器,并通过 AppEngine 的套接字支持与其对话。唯一的问题是似乎没有特定的防火墙规则说“此 AppEngine 应
我想知道 App Engine 和 Compute Engine 之间有什么区别。任何人都可以向我解释其中的区别吗? 最佳答案 App Engine 是一种平台即服务。这意味着您只需部署代码,平台会为
我正在编写一个在 App Engine 的 Go 运行时上运行的 Go 应用程序。 我注意到几乎所有使用 App Engine 服务(例如 Datastore、Mail 甚至 Capabilities
是否有人有在 Grid Engine/Sun Grid Engine/Son of Grid Engine 上运行 Docker 的经验,并且能够 monitor the resource used
我读了很多论坛,因为 grails app-engine 插件多年来没有更新,所以不可能将 grails 应用程序部署到谷歌应用程序引擎。当我准备放弃时,我发现使用 intellij 部署项目是可能的
当前设置, 运行 Windows Server 2012 (GCE Server 2012) 的谷歌计算引擎 运行 Debian Wheezy(GCE 服务器 Wheezy)的 Google 计算引擎
特定于基于 Docker 的部署,这两者之间有什么区别?由于 Google App Engine Flexible 现在也支持基于 Dockerfile 的部署,并且它也是完全托管的服务,因此它似乎比
我相信 Google Kubernetes Engine (GKE) 在 Google Compute Engine (GCE) 上运行。那么,在服务器管理方面使用 Google Kubernetes
TLDR;关于这个问题有任何更新吗? Google App Engine communicate with Compute Engine over internal network -- 是否可以在同
我正在尝试使用 Go SDK 为 App Engine 编写应用程序,但它似乎与单元测试有一种有趣的关系。人有written libraries左右this original, outdated一组工
在 App Engine 中,我想对在同一个 Google 云项目中创建的 Compute Engine 实例上运行的网络服务器进行 http fetch 调用,我想知道是否可以在不启用的情况下对实例
在编写 Go App Engine 标准应用程序时,过去的情况是您必须使用 App Engine SDK访问数据存储。然而,最近(从 Go 1.11 开始?),如果你只使用 Cloud Datasto
我是一名优秀的程序员,十分优秀!