Home Artists Posts Import Register

Content

修正 Youtube 字幕斷句

有使用過 YouTube 字幕的用戶們可能知道,YouTube 自動生成的字幕由於斷句的問題(即多組句子會混在一起),導致使用這些字幕學習語言的體驗不佳。另外,由於翻譯字幕也是直接從這些字幕進行翻譯的,這也使得翻譯字幕,例如中文字幕的句子也會發生同樣的問題。



本人曾經在去年開發過 Listen and Repeat - Language Learning 插件,嘗試解決這個問題。解決方案是讓用戶以拖放字幕句子的形式自行處理這個問題。這個方法現在看起來很愚蠢,同時也浪費用戶寶貴的時間。現在我們有了 AI,我們可以輕易地解決這個問題。


首先,我們需要在字幕菜單選擇 "生成字幕 (ybs)",插件就會發送請求讓伺服器處理這些字幕


處理完成後的字幕將會是完整的句子,標點符號也會被加上,閱讀體驗就可以得到提升。


翻譯功能

解決了斷句的問題,我們就可以進一步改善翻譯質素的問題。我們提供英語轉換其他語言的服務,以下是自動生成字幕和修正字幕的翻譯對比:


除了以上兩個主要功能外, 我們也對插件進行了以下更新: 


放棄植入原生菜單

由於植入原生菜單的故障率很高的緣故, 我們把菜單移到播放器外。


修正繁體中文字幕

Youtube 的自動生成字幕 ( 繁體 ) 存在字幕在開頭就播放完的問題, 我們把簡體字幕進行轉換作為替代方案。


Q&A


1. 點擊生成字幕後,字幕顯示"生成中"是甚麼意思?

 這代表伺服器正在處理您的請求。如果顯示"排隊中",即代表前方有其他用戶的請求正在等候處理。如果在排隊過程中途離開或切換影片,系統會自動跳過您的請求。


2. 為甚麼翻譯時間那麼久?

現時我們的翻譯功能是由我們建置的伺服器自行處理的。以我們現時的運算能力,50 分鐘的影片由英語轉為中文約需時 25 秒。如果排隊人數眾多,等候時間會更久。


為甚麼我們不使用其他翻譯服務(如 Google Translate)?

這是因為翻譯服務的費用高昂,現時的我們很難承擔這些費用。50 分鐘的影片大約有 2 萬個字元,Google Cloud Translation 每百萬字元收費 20 美元。考慮到我們大部分的用戶都是學生,需要翻譯的影片可能都是線上課程這些長影片,所以我們選擇建置伺服器自行處理,代價就是慢點,但是可以無限量提供!而且有了你們的支持,我們也能逐步提升我們的硬件規格和運算能力。


3. 把資料發送到你的伺服器安全嗎?

插件發送請求的訊息只包含影片ID,不會發送任何關聯到用戶的任何資料,我們也不會儲存任何記錄,包括請求來源,IP 等等。


4. 為甚麼有些影片找不到生成字幕的選項?

現時只有提供自動生成字幕(英文)的字幕才能使用修正斷句和翻譯功能,日後會支援更多自動生成字幕語種,例如日文,西班牙文等等。 


5. 為甚麼我訂閱的是 Netflix 雙語字幕而你卻在開發 YouTube 雙語字幕?

自 Netflix 雙語字幕上架已有兩年,我們一直在思考新的功能,聽寫模式就是其中之一,有些功能其他插件已經做得很好,我們也不想重做這些功能。考慮到我們的用戶大多是語言學習者,我們相信做好 YouTube 雙語字幕對我們的用戶是有很大幫助的。YouTube 上可供學習的影片數比 Netflix 多,唯一缺點就是自帶的字幕難以進行學習,我們希望藉著解決這個問題以幫助我們的用戶更好地學習語言。


連結

Chrome:
Youtube Bilingual Subtitles - Chrome Web Store (google.com)

Firefox:
Youtube Bilingual Subtitles – Get this Extension for 🦊 Firefox (en-US) (mozilla.org)

Comments

No comments found for this post.