python - 将 Universal Sentence Encoder 保存到 Tflite 或将其提供给 tensorflow api-6ren

python - 将 Universal Sentence Encoder 保存到 Tflite 或将其提供给 tensorflow api

转载作者：行者123 更新时间：2023-12-05 06:19:04

31

4

我有这段代码可以使用预构建的通用句子编码器来查找句子相似度。它需要一个 .txt 文件作为输入。执行余弦相似度，然后接受用户的输出以根据用户输入查询找到最相似的句子。这是代码:

# tensroflow hub module for Universal sentence Encoder
module_url = "https://tfhub.dev/google/universal-sentence-encoder-large/3" #@param ["https://tfhub.dev/google/universal-sentence-encoder/2", "https://tfhub.dev/google/universal-sentence-encoder-large/3"]

def get_features(texts):
    if type(texts) is str:
        texts = [texts]
    with tf.Session() as sess:
        sess.run([tf.global_variables_initializer(), tf.tables_initializer()])
        return sess.run(embed(texts))
    def remove_stopwords(stop_words, tokens):
    res = []
    for token in tokens:
        if not token in stop_words:
            res.append(token)
    return res

def process_text(text):
    text = text.encode('ascii', errors='ignore').decode()
    text = text.lower()
    text = re.sub(r'http\S+', ' ', text)
    text = re.sub(r'#+', ' ', text )
    text = re.sub(r'@[A-Za-z0-9]+', ' ', text)
    text = re.sub(r"([A-Za-z]+)'s", r"\1 is", text)
    #text = re.sub(r"\'s", " ", text)
    text = re.sub(r"\'ve", " have ", text)
    text = re.sub(r"won't", "will not ", text)
    text = re.sub(r"isn't", "is not ", text)
    text = re.sub(r"can't", "can not ", text)
    text = re.sub(r"n't", " not ", text)
    text = re.sub(r"i'm", "i am ", text)
    text = re.sub(r"\'re", " are ", text)
    text = re.sub(r"\'d", " would ", text)
    text = re.sub(r"\'ll", " will ", text)
    text = re.sub('\W', ' ', text)
    text = re.sub(r'\d+', ' ', text)
    text = re.sub('\s+', ' ', text)
    text = text.strip()
    return text

def lemmatize(tokens):
    lemmatizer = nltk.stem.WordNetLemmatizer()
    lemma_list = []
    for token in tokens:
        lemma = lemmatizer.lemmatize(token, 'v')
        if lemma == token:
            lemma = lemmatizer.lemmatize(token)
        lemma_list.append(lemma)
    # return [ lemmatizer.lemmatize(token, 'v') for token in tokens ]
    return lemma_list


def process_all(text):
    text = process_text(text)
    return ' '.join(remove_stopwords(stop_words, text.split()))

process_text("Hello! Who are you?")

with open('/content/sample_data/training.txt') as f:
...     text = [i.strip() for i in f]
...     

data_processed = list(map(process_text, text))
len(data_processed)

BASE_VECTORS = get_features(text)

def cosine_similarity(v1, v2):
    mag1 = np.linalg.norm(v1)
    mag2 = np.linalg.norm(v2)
    if (not mag1) or (not mag2):
        return 0
    return np.dot(v1, v2) / (mag1 * mag2)

def test_similiarity(text1, text2):
    vec1 = get_features(text1)[0]
    vec2 = get_features(text2)[0]
    print(vec1.shape)
    return cosine_similarity(vec1, vec2)

def semantic_search(query, data, vectors):
    query = process_text(query)
    print("Extracting features...")
    query_vec = get_features(query)[0].ravel()
    res = []
    for i, d in enumerate(data):
        qvec = vectors[i].ravel()
        sim = cosine_similarity(query_vec, qvec)
        res.append((sim, d[:100], i))
    return sorted(res, key=lambda x : x[0], reverse=True)

semantic_search("da vinci", data_processed, BASE_VECTORS)

我想保存模型并将其转换为 tflite。我进行了很多研究，但未能找到任何解决方案。或者如何将其提供给 tensorflow api。

最佳答案

继续的一个选项是将模型保存在 SavedModel format 中，然后将生成的模型转换为 tflite。请注意，转换模型的能力可能取决于模型正在使用的操作，并且某些模型架构可能无法转换为 tflite format .

关于python - 将 Universal Sentence Encoder 保存到 Tflite 或将其提供给 tensorflow api，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60991417/

31

4

0

文章推荐： c# - 如何触发 Windows 的用户凭据提示？

文章推荐： asp.net-core - 如何使用 Seq sink 配置 Serilog aspnetcore？

文章推荐： ruby-on-rails - Rails 6 不提供静态文件

文章推荐： android - 如何在 PageView 中设置不同大小的页面？

java - 具有默认安全性的 Spring Security 为 PUT 提供 401，为 GET 提供 200
我开发了一个具有基本安全性的 Spring Boot 应用程序。我有两个具有相同路径和不同 http 方法的端点。当我使用默认密码/使用 application.yml 中给出的密码包含基本安全性时，
html - 如何向 Firefox 3.6 提供 OGG 视频和向 Firefox 4 提供 WEBM 视频？
我的代码是这样的: 或者，像这样: 如果我首先列出 webm 源，Firefox 4 会播放它，但 Firefox 3.6 也会尝试播放它(但会失败，因为它不支持 webm)。
TypeScript 提供(未指定的)泛型类型作为泛型参数
我希望提供一个泛型类型作为类型参数而不首先将其解析为具体类型。换句话说，我正在寻找一种方法来指定从基类继承时可以使用的类型映射函数。示例(不正确的)语法，希望比我能解释得更好: abstract c
.net - 提供 GUI 和命令行界面的应用程序的程序集名称应该是什么？
我在 .NET 中编写了一些桌面应用程序，它们既提供了用于正常使用的前端 GUI，也提供了用于其他需求(例如扩展、调度、自动化、高级使用等)的命令行界面。命名两个可执行文件的最佳做法是什么，因为它们构
json - 提供 API 是否有助于阻止屏幕抓取？
我最近在这里思考了很多关于屏幕抓取以及它可能是一项什么样的任务。所以我提出以下问题。作为网站开发人员，您是否会公开简单的 API 以防止用户抓取屏幕，例如 JSON 结果？然后这些结果可以实现缓存
dojo - 更新 Dojo 提供
我正在为一个项目使用 Dojo 1.9，但我不明白 dojo.provide 的正确替代方案与传统风格相比，AMD 风格。我正在阅读 this文档页面。很明显，这就是旧语法映射到新语法的方式: 旧
angular - 提供 Angular 构建时出现非法状态问题中的错误
我正在开发一个 Angular 应用程序。当我使用 ng serve 正常运行它时，它运行没有任何错误.但是，当我运行 ng build --prod ，它给出了以下错误。 ERROR in Ille
cocoa - 提供 Mac 应用程序的打印选项
我有一个 Mac 应用程序。在我的 Mac 应用程序中，我的屏幕之一有一个包含文本字段的 scrollView。在同一屏幕上，我有一个需要提供打印选项的按钮。可以打印文本字段的文本。打印按钮应调用 M
Django:提供 ADMIN 媒体文件
我已经成功地为普通媒体文件提供媒体文件，但是当我尝试提供管理媒体文件时，我失败了。请帮我找出问题所在，因为我已经尝试解决问题几个小时但没有运气(也一直在谷歌搜索并阅读有关提供静态文件的 django
java - 提供 JSON 的错误处理
我正在尝试创建一个简单的错误处理项目，它会在收到错误(例如 404、422 或 500)后为 JSON 提供错误数据。我使用来自 this 的代码网站，但它不适合我。我实际上有这两个类: 基本 Co
java - 提供 equals() 的替代方案吗？
假设我有一个名为 Number 的类(class)，我打算对 Number 进行大量相等比较对象。我担心通用 Number::equals(Object o) 的“开销”(类比较等...)方法。在这种
google-chrome - Webrtc对等连接使用不同的sdpConstraints创建应答/提供
假定以下情况: 对等方A只希望将音频流发送给对等方B 对等B只希望将视频流发送给对等A 从而，与创建报价 var sdpConstraints = { “必填”:{ 'OfferToReceiveA
c# - 提供 FluentAssertions 的扩展
因为我有一些角度，所以我想检查角度模数 360°: double angle = 0; double expectedAngle = 360; angle.Should().B
haskell - 提供 monad 堆栈的测试实现
这是我的程序中构建的 monad 堆栈: type Px a = ReaderT PConf (State PState) a 其中 PConf 和 PState 是保存应用程序的配置和状态的任意数据
c# - 提供 FluentAssertions 的扩展
因为我有一些角度，所以我想检查角度模数 360°: double angle = 0; double expectedAngle = 360; angle.Should().B
java - 提供 Applet 安全异常的后备方案
我有一个小程序需要以某些权限运行，这意味着加载时会显示一条警告消息。如果用户拒绝警告消息，我想重定向到错误页面并解释发生了什么。有什么办法可以做到这一点吗？我研究过让计时器运行并在特定时间段后重定向
firebase - 提供 Firebase 应用的静态内容
从我可以从 Firebase 文档中推断出，似乎需要服务器来提供静态内容(html和 javascript)，所以你需要有一台托管机器和一个静态内容服务器在某处启动并运行，或某些服务托管静态站点。对
javascript - 提供 UML 作为带有代码的文档是个好主意吗？
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 3 年前。 Improv
python - 提供 django 静态文本文件
我的项目根目录的静态文件夹中有一个文本文件。我想提供它，所以我创建了: @csrf_exempt def display_text(request): content = retur
使用指针连接两个数组(提供 C 代码)
我目前正在研究指针，为了进一步理解我正在尝试使用指针将两个数值数组连接成一个。代码如下所示。 #include void concat(int **pa,int **pb,int **pc) {

首页

博学

6Ren·AI

商城

python - 将 Universal Sentence Encoder 保存到 Tflite 或将其提供给 tensorflow api