輕鬆實現文字與語音互轉

文字和語音各有所長，一個省聽力，一個省眼力，你不能說哪個好，哪個不好。因此，有時候我們往往會各取所需。但是，如果你需要的是文字，而手頭上偏偏只有語音或含有語音信息的視頻，那麼這時就需要進行轉換。反之亦然。為此，我們就需要掌握能夠在二者之間實現輕鬆互轉的方法。利用“文字轉換語音”APP，便可以滿足這些需求。

文|波哥

　　“文字轉換語音”能夠實現文字轉語音、長音頻轉文字、人工智能語音實時自動轉文字、拍照取字、在線錄音快速轉文字、視頻轉文字等功能。此外，還可以實現文檔語音朗讀、音頻裁剪和拼接混合、音頻格式轉換等常用需求。

　　安裝之後運行該軟件，點擊“同意並繼續”按鈕通過用戶協議與隱私政策文件。之後會進入軟件的主界面，其中共顯示有6個功能模塊可供選擇（圖1）。

　　（圖1 軟件所包含的幾個重要模塊）

　　在使用該軟件時，由於要進行通話和本地錄音，涉及文件的讀寫操作，因此需要通過系統的兩個權限選擇（圖2、圖3）。

　　（圖2 放開通話錄音和本地錄音權限）

　　（圖3 放開文件讀寫權限）

　　1. 將文字轉為語音

　　啟動“文字轉換語音”模塊，先輸入或粘貼文本，可添加背景音樂。然後點擊“語音試聽”按鈕試聽轉換效果（圖4）。

　　（圖4 輸入文本內容試聽語音效果）

　　我們也可以通過設置，獲得不同的語音效果。點擊“語音設置”按鈕，對語音參數進行設置，包括朗讀人物類型、語音格式選擇，以及音量、音速、音調等的設置（圖5）。

　　（圖5 語音轉換效果的參數設置）

　　如果測試結果滿意，則點擊“保存語音”按鈕保存即可。

　　如果僅僅是為了測試效果，則可以點擊“文本模板”調用一段現成的文字來測試（圖6）。

　　（圖6 從現成的文字模板中選擇）

　　例如，我們調用如圖所示的一段文字之後，點擊“語音試聽”，若不滿意則點擊“語音設置”按鈕重新設置參數，如果滿意則點擊“保存語音”保存即可（圖7）。

　　（圖7 一個文字轉換語音的例子）

　　2. 識別音頻文件中的文字信息

　　利用“長音頻轉文字”模塊，可以將語音文件中的聲音信息轉換為文字內容。調入需要轉換的音頻文件並播放，如果沒有問題，點擊“確定”按鈕進行轉換即可（圖8）。

　　（圖8 識別音頻中的文字信息）

　　注意，此過程需要微信一鍵登錄後才能執行（圖9）。

　　（圖9 需要微信一鍵登錄軟件）

　　3. 現場語音實時轉換為文字

　　如果要將現場的語音信息實時地轉換為文字信息，可以利用“語音實時轉寫”模塊來實現。先啟動該模塊，然後點擊“語音識別”窗口底部的“開始識別”按鈕，開始講話，軟件會自動識別語音內容，並將其轉變為文字顯示在窗口中。內容顯示之後，點擊“複製內容”按鈕，即可利用這些文字（圖10）。

　　（圖10 點擊“開始識別”識別現場語音）

　　語音識別目前支持普通話、英語、粵語、四川話等4種類型，通過窗口右上角的語言選擇下拉列表來選擇（圖11）。

　　（圖11 現場語音識別所支持的語言種類）

　　４. 從視頻中識別並轉換文字

　　如果需要將視頻中的語音內容轉換為文字信息，那麼可以利用“視頻轉文字”模塊來實現。啟動該模塊之後，先選擇要處理的視頻文件（圖12）。

　　（圖12 選擇要處理的視頻文件）

　　接下來會顯示視頻時長，以及轉換消耗的時長信息，點擊“確定”按鈕開始轉換即可（圖13）。

　　（圖13 開始識別視頻中的文字）

　　５. 將在線音頻信息轉換為文字

　　我們還可以將網絡在線的音頻內容轉換為文字。為此，可以啟動“在線作品識別”模塊，然後在地址框中輸入或粘貼在線地址、雲盤文件地址等。最後點擊“開始識別”按鈕進行語音識別（圖14）。

　　（圖14 識別在線音頻並轉換為文字信息）

　　６. 其他文字及音視頻相關工具

　　該軟件還附帶了幾個文字、音視頻處理相關的工具可供我們選擇。其中包括：“拍照取字”“音頻提取”“音頻裁剪”“音頻拼接”“音頻混合”“格式轉換”等工具（圖15）。

　　（圖15 軟件所附帶的幾個相關工具）

　　利用“拍照取字”工具，我們可以對含有文字的作品或物體進行現場拍照，然後將照片中的文字識別為文本信息。首先點擊“拍照/相冊”按鈕拍照，或從相冊中選擇已經拍好的照片。之後軟件會將照片中的文字自動識別出來並顯示在窗口中。識別出來的文字可以試聽語音效果，也可以複製利用。語音效果可以保存為語音文件留存（圖16）。

　　（圖16 識別照片中的文字信息並轉換為語音）

　　有時候我們僅僅需要視頻中的音頻信息。利用“音頻提取”工具，可以將視頻中的音頻提取出來。選擇視頻文件之後，點擊“提取音頻”按鈕即可提取（圖17）。

　　（圖17 從視頻中提取音頻信息）

　　我們還可以利用“音頻混合”工具，實現兩段或多段音頻疊加的混音效果，用多個音頻文件合成一個音頻文件。首先選擇要實現混音合成的音頻文件，然後點擊底部的“混合已選”按鈕執行合併即可（圖18）。

　　（圖18 實現音頻的混音疊加效果）

　　如果希望從一段音頻中剪輯出有用的片段，那麼利用“音頻裁剪”工具來實現。啟動該工具後，通過滑塊來選擇開始時間點和結束時間點，然後調整音量和速度，如果需要還可以給音頻片段的首尾設置淡入淡出效果。最後點擊“保存已選音頻”按鈕保存要保留的音頻，或者通過點擊“刪除已選音頻”按鈕刪除要剔除的音頻片段即可（圖19）。

　　（圖19 利用音頻剪輯工具保留或刪除音頻片段）

　　上面我們介紹過音頻混音。除了混音外，多段音頻還可以進行連接，成為一個長音頻文件。“音頻拼接”工具就可以實現音頻拼接。首先選擇要合併的音頻文件，然後點擊“合併已選”，執行音頻合併即可（圖20）。

　　（圖20 選擇多段要合併的音頻執行合併）

　　有時候我們需要將一種格式的音頻文件轉換為另一種，用“格式轉換”工具可以實現。啟動該模塊之後，首先調入要轉換的音頻文件，然後選擇需要轉換為的目標音頻格式。最後點擊“確定”開始轉換即可（圖21）。

　　（圖21 將音頻從一種格式轉換為另一種）

　　由此可見，利用“文字轉換語音”，不單單能實現從文字到語音的轉換，還能夠實現我們日常所需要的文字、音頻、視頻的轉換和日常處理。該軟件已不是一個功能單一的工具，它的各項功能值得我們充分挖掘和利用。CF

原文刊登於2022 年 12月15 日出版《電腦愛好者》第 24 期

END

相關文章