輕鬆實現文字與語音互轉

輕鬆實現文字與語音互轉

文字和語音各有所長,一個省聽力,一個省眼力,你不能說哪個好,哪個不好。因此,有時候我們往往會各取所需。但是,如果你需要的是文字,而手頭上偏偏只有語音或含有語音信息的視頻,那麼這時就需要進行轉換。反之亦然。為此,我們就需要掌握能夠在二者之間實現輕鬆互轉的方法。利用“文字轉換語音”APP,便可以滿足這些需求。

文|波哥

  

  文字和語音各有所長,一個省聽力,一個省眼力,你不能說哪個好,哪個不好。因此,有時候我們往往會各取所需。但是,如果你需要的是文字,而手頭上偏偏只有語音或含有語音信息的視頻,那麼這時就需要進行轉換。反之亦然。為此,我們就需要掌握能夠在二者之間實現輕鬆互轉的方法。利用“文字轉換語音”APP,便可以滿足這些需求。

  “文字轉換語音”能夠實現文字轉語音、長音頻轉文字、人工智能語音實時自動轉文字、拍照取字、在線錄音快速轉文字、視頻轉文字等功能。此外,還可以實現文檔語音朗讀、音頻裁剪和拼接混合、音頻格式轉換等常用需求。

  安裝之後運行該軟件,點擊“同意並繼續”按鈕通過用戶協議與隱私政策文件。之後會進入軟件的主界面,其中共顯示有6個功能模塊可供選擇(圖1)。

  (圖1 軟件所包含的幾個重要模塊)

  在使用該軟件時,由於要進行通話和本地錄音,涉及文件的讀寫操作,因此需要通過系統的兩個權限選擇(圖2、圖3)。

  (圖2  放開通話錄音和本地錄音權限)

  (圖3  放開文件讀寫權限)

  1. 將文字轉為語音

  啟動“文字轉換語音”模塊,先輸入或粘貼文本,可添加背景音樂。然後點擊“語音試聽”按鈕試聽轉換效果(圖4)。

  (圖4  輸入文本內容試聽語音效果)

  我們也可以通過設置,獲得不同的語音效果。點擊“語音設置”按鈕,對語音參數進行設置,包括朗讀人物類型、語音格式選擇,以及音量、音速、音調等的設置(圖5)。

  (圖5  語音轉換效果的參數設置)

  如果測試結果滿意,則點擊“保存語音”按鈕保存即可。

  如果僅僅是為了測試效果,則可以點擊“文本模板”調用一段現成的文字來測試(圖6)。

  (圖6  從現成的文字模板中選擇)

  例如,我們調用如圖所示的一段文字之後,點擊“語音試聽”,若不滿意則點擊“語音設置”按鈕重新設置參數,如果滿意則點擊“保存語音”保存即可(圖7)。

  (圖7  一個文字轉換語音的例子)

  2. 識別音頻文件中的文字信息

  利用“長音頻轉文字”模塊,可以將語音文件中的聲音信息轉換為文字內容。調入需要轉換的音頻文件並播放,如果沒有問題,點擊“確定”按鈕進行轉換即可(圖8)。

  (圖8  識別音頻中的文字信息)

  注意,此過程需要微信一鍵登錄後才能執行(圖9)。

  (圖9  需要微信一鍵登錄軟件)

  3. 現場語音實時轉換為文字

  如果要將現場的語音信息實時地轉換為文字信息,可以利用“語音實時轉寫”模塊來實現。先啟動該模塊,然後點擊“語音識別”窗口底部的“開始識別”按鈕,開始講話,軟件會自動識別語音內容,並將其轉變為文字顯示在窗口中。內容顯示之後,點擊“複製內容”按鈕,即可利用這些文字(圖10)。

  (圖10  點擊“開始識別”識別現場語音)

  語音識別目前支持普通話、英語、粵語、四川話等4種類型,通過窗口右上角的語言選擇下拉列表來選擇(圖11)。

  (圖11  現場語音識別所支持的語言種類)

  4. 從視頻中識別並轉換文字

  如果需要將視頻中的語音內容轉換為文字信息,那麼可以利用“視頻轉文字”模塊來實現。啟動該模塊之後,先選擇要處理的視頻文件(圖12)。

  (圖12  選擇要處理的視頻文件)

  接下來會顯示視頻時長,以及轉換消耗的時長信息,點擊“確定”按鈕開始轉換即可(圖13)。

  (圖13  開始識別視頻中的文字)

  5. 將在線音頻信息轉換為文字

  我們還可以將網絡在線的音頻內容轉換為文字。為此,可以啟動“在線作品識別”模塊,然後在地址框中輸入或粘貼在線地址、雲盤文件地址等。最後點擊“開始識別”按鈕進行語音識別(圖14)。

  (圖14  識別在線音頻並轉換為文字信息)

  6. 其他文字及音視頻相關工具

  該軟件還附帶了幾個文字、音視頻處理相關的工具可供我們選擇。其中包括:“拍照取字”“音頻提取”“音頻裁剪”“音頻拼接”“音頻混合”“格式轉換”等工具(圖15)。

  (圖15  軟件所附帶的幾個相關工具)

  利用“拍照取字”工具,我們可以對含有文字的作品或物體進行現場拍照,然後將照片中的文字識別為文本信息。首先點擊“拍照/相冊”按鈕拍照,或從相冊中選擇已經拍好的照片。之後軟件會將照片中的文字自動識別出來並顯示在窗口中。識別出來的文字可以試聽語音效果,也可以複製利用。語音效果可以保存為語音文件留存(圖16)。

  (圖16  識別照片中的文字信息並轉換為語音)

  有時候我們僅僅需要視頻中的音頻信息。利用“音頻提取”工具,可以將視頻中的音頻提取出來。選擇視頻文件之後,點擊“提取音頻”按鈕即可提取(圖17)。

  (圖17  從視頻中提取音頻信息)

  我們還可以利用“音頻混合”工具,實現兩段或多段音頻疊加的混音效果,用多個音頻文件合成一個音頻文件。首先選擇要實現混音合成的音頻文件,然後點擊底部的“混合已選”按鈕執行合併即可(圖18)。

  (圖18  實現音頻的混音疊加效果)

  如果希望從一段音頻中剪輯出有用的片段,那麼利用“音頻裁剪”工具來實現。啟動該工具後,通過滑塊來選擇開始時間點和結束時間點,然後調整音量和速度,如果需要還可以給音頻片段的首尾設置淡入淡出效果。最後點擊“保存已選音頻”按鈕保存要保留的音頻,或者通過點擊“刪除已選音頻”按鈕刪除要剔除的音頻片段即可(圖19)。

  (圖19  利用音頻剪輯工具保留或刪除音頻片段)

  上面我們介紹過音頻混音。除了混音外,多段音頻還可以進行連接,成為一個長音頻文件。“音頻拼接”工具就可以實現音頻拼接。首先選擇要合併的音頻文件,然後點擊“合併已選”,執行音頻合併即可(圖20)。

  (圖20  選擇多段要合併的音頻執行合併)

  有時候我們需要將一種格式的音頻文件轉換為另一種,用“格式轉換”工具可以實現。啟動該模塊之後,首先調入要轉換的音頻文件,然後選擇需要轉換為的目標音頻格式。最後點擊“確定”開始轉換即可(圖21)。

  (圖21  將音頻從一種格式轉換為另一種)

  由此可見,利用“文字轉換語音”,不單單能實現從文字到語音的轉換,還能夠實現我們日常所需要的文字、音頻、視頻的轉換和日常處理。該軟件已不是一個功能單一的工具,它的各項功能值得我們充分挖掘和利用。CF

原文刊登於2022 年 12月15 日出版《電腦愛好者》第 24 期

END

更多精彩,敬請期待……

Scroll to Top