java - 解析 LIUM 说话人二值化输出-6ren

java - 解析 LIUM 说话人二值化输出

转载作者：塔克拉玛干更新时间：2023-11-02 08:03:13

24

4

如何使用 LIUM Speaker Diarization 工具包知道哪个演讲者讲了多少时间？

例如，这是我的 .seg 文件。

;; cluster S0 [ score:FS = -33.93166562542459 ] [ score:FT = 
-34.24966646974656 ] [ score:MS = -34.05223781565528 ] [ score:MT = 
-34.32834794609819 ] 
Seq06 1 0 237 F S U S0
Seq06 1 2960 278 F S U S0
;; cluster S1 [ score:FS = -33.33289449700619 ] [ score:FT = 
-33.64489165914674 ] [ score:MS = -32.71833169822944 ] [ score:MT = 
-33.380835069917275 ] 
Seq06 1 238 594 M S U S1
Seq06 1 1327 415 M S U S1
Seq06 1 2311 649 M S U S1
;; cluster S2 [ score:FS = -33.354874450638064 ] [ score:FT = 
-33.46618707052516 ] [ score:MS = -32.70702429201772 ] [ score:MT = 
-33.042146088874844 ] 
Seq06 1 832 495 M S U S2
Seq06 1 1742 569 M S U S2

如何从这个文件中提取时间？

最佳答案

在这一行

Seq06 1 2960 278 F S U S0

你有

field 1: Seq06 = the show name
field 2: 1 = the channel number
field 3: 2960 = the start of the segment (in features)
field 4: 278 = the length of the segment (in features)
field 5: F = the speaker gender (U=unknown, F=female, M=Male)
field 6: S = the type of band (T=telephone, S=studio)
field 7: U = the type of environment (music, speech only, …)
field 8: S0 = the speaker label

时间以特征为单位，因此 2960 为 29.60 秒(除以 100 以从特征秒数转换)。长度也在特征中，因此您的片段长度为 2.78 秒。

记录在 LIUM WIKI 中

关于java - 解析 LIUM 说话人二值化输出，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45309366/

24

4

0

文章推荐： java - java连接Ms access数据库的方法

文章推荐： iOS将按钮的发送事件从Touch Down更改为Touch UP Inside？

文章推荐： java - 在泛型上调用 Enum.values()

ios - 如何禁用替换、插入绘图、查找、学习、说话、说话..、在 UI 文本字段上暂停？
我在 uipickerview 中有一个 uitextfield，我试图禁用任何类型的格式，我使用 UIResponderStandardEditActions 来禁用随之而来的所有操作，但我不知道如
python - 如何让 Python 说话
如何让 Python 说出一些文字？我可以将 Festival 与子进程一起使用，但我无法控制它(或者可能在交互模式下，但它不会是干净的)。是否有 Python TTS 库？像 Festival、
android - 用 TTS 说话，例如印地语
在我的应用程序中，我想知道是否有任何可以阅读印地文文本的 tts 引擎。我的代码 tts.setLanguage(Locale.US); 很遗憾，Android 不支持印地语。请参阅下面支持的语言环境
[MAUI]模仿微信“按住-说话”的交互实现
@ 目录创建页面布局创建手势控件创建TalkBox 创建动画拖拽物动画
javascript - Angular 模态不会关闭(让 $scopes 说话)
我有一个简单的 Angular 模态，是用 Angular ui.bootstrap 引发的。它打开得很好，传递值等，但不会关闭或取消。我认为这是 $scopes 的讨论问题。我知道每个模式都有自己的
css - “sass”和“ssss”说话/发音
scss基本上是sass功能的改进实现。我的工作区使用.scss文件。什么是正确的或通用的方式来指代scss时说？我们刚刚把这些文件称为“sass”文件。在只使用scss而不使用sass文件的环境中，
php - 字符串转 Leet (1337) 用 PHP 说话
有谁知道我在哪里可以找到一个好的起点来编写一个函数，该函数接受一个字符串并将其转换为 leet speak？ function stringToLeetSpeak($string) { // Lo
twilio - 是否可以检测谁在使用 Twilio Video JS SDK 说话？
我目前正在实现视频通话应用程序，例如使用 Twilio Video 的 Google Hangout。我想在后台显示当时正在讲话的人的视频。是否可以检测谁在使用 Twilio Video JS SD
python - "Teach"Python 其他语言(TTS 说话...)如何？
所以我找到了这段代码: #!/usr/bin/python import sys #for cmd line argv import time #for delay import p
javascript - 如何让 Webhook 通过 Discord Bot 说话(循环)
我想让我的机器人能够制作一个 webhook，由命令触发，然后 webhook 可以在一定间隔内说出消息。我想获取已创建的 webhook 的 token 和 id，然后将其放在一个持续不断的 set
amazon-web-services - 是否可以调用带有负载的 AWS Lambda 函数来让 Alexa 说话？
我想让 Alexa 说出对意图的响应，但是通过手动调用包含 Alexa 技能代码的 Lambda 函数，而不是直接对 Echo 说出意图。例如，您能否以某种方式(通过 AWS-SDK 或通过物联网“
python - 在 Django View 中长时间、缓慢的操作会导致超时。有什么方法可以让 Python 代替 AJAX 说话？
我编写 Python 有一段时间了，但 DJango 和一般的 Web 编程对我来说是新的。我在 Python View 中执行了一个很长的操作。由于我认为 local() 函数需要很长时间才能返回

首页

博学

6Ren·AI

商城

java - 解析 LIUM 说话人二值化输出