【識粵語嘅朋友,可唔可以用五分鐘幫手建立粵語語音識別庫】 #粵語
有人整緊一個粵語嘅語音數據集,想收集唔同人朗讀句子嘅錄音,會用來訓練gpt或者其他AI。如果你唔想捐出自己把聲,都可以幫手聽聲驗證。
今日唔得閒,唔緊要,可以 forward 畀身邊嘅朋友幫手,可以聽日返來再錄。粵語有一億人識得講,揾一百個人,冇難度啦係咪?
【錄音入呢度】:https://commonvoice.mozilla.org/yue
【聽聲請注意】:本項目係收集「所有粵語區」嘅語音,希望可以train到個機器可以兼容識別唔同粵語口音。所以聽錄音陣時,如果聽到唔係自己鄉音,唔好否決佢。有口音冇所謂,聽得明就得。
有任何疑問,可以去Twitter揾@Can_CLID 或者入群組 https://t.me/commonvoiceyue
請大家注意!Mozilla Yue 係收集「所有粵語區」嘅語音,希望可以train到個系統可以包容唔同粵語口音。
所以大家聽錄音陣時,如果聽到唔係自己鄉音,唔好否決佢。有口音冇所謂,聽得明就得。
個準則係:朗讀要準確清晰自然,唔可以有口誤讀錯字,把聲要清楚連貫唔可以有大噪音聽唔清,但係口音係冇所謂,聽得明就得。