崗位職責(zé):
1、主導(dǎo)面向自然語言處理(NLP)大模型、多模態(tài)融合模型(包含計(jì)算機(jī)視覺、語音處理與自然語言處理的結(jié)合)、語音降噪和增強(qiáng)算法等方向的前沿應(yīng)用技術(shù)研究。重點(diǎn)探索深度學(xué)習(xí)技術(shù)在語音降噪和增強(qiáng)中的應(yīng)用,特別是在復(fù)雜噪聲環(huán)境下提升語音信號(hào)質(zhì)量,為語音識(shí)別和方言識(shí)別等后續(xù)應(yīng)用提供高質(zhì)量輸入。
2、深入研究自然語言處理中的方言識(shí)別技術(shù),利用深度學(xué)習(xí)模型(如Transformer架構(gòu))和大規(guī)模方言語料庫(kù),開發(fā)高效的方言識(shí)別系統(tǒng),支持多種中國(guó)方言的準(zhǔn)確識(shí)別和轉(zhuǎn)換,推動(dòng)方言保護(hù)與應(yīng)用的創(chuàng)新。
3、研究計(jì)算機(jī)視覺領(lǐng)域的目標(biāo)檢測(cè)、圖像分割、視頻分析等技術(shù),結(jié)合自然語言處理能力,實(shí)現(xiàn)圖像內(nèi)容的精準(zhǔn)描述與理解,以及視頻中關(guān)鍵信息的提取與語義化表達(dá),推動(dòng)多模態(tài)數(shù)據(jù)融合的創(chuàng)新應(yīng)用。
4、結(jié)合政務(wù)服務(wù)、企業(yè)辦公、工業(yè)生產(chǎn)等垂直領(lǐng)域,構(gòu)建基于自然語言處理大模型與深度學(xué)習(xí)算法的行業(yè)知識(shí)庫(kù)系統(tǒng)。在計(jì)算機(jī)視覺方面,優(yōu)化圖像、視頻等視覺數(shù)據(jù)的處理流程,包括特征提取、數(shù)據(jù)標(biāo)注等,為知識(shí)圖譜構(gòu)建提供豐富的視覺信息;在語音處理方面,完善語音數(shù)據(jù)的降噪、增強(qiáng)與轉(zhuǎn)錄,特別是針對(duì)中國(guó)方言的語音數(shù)據(jù),確保語音知識(shí)的準(zhǔn)確入庫(kù)。
5、優(yōu)化知識(shí)圖譜構(gòu)建過程中的深度學(xué)習(xí)算法,提高知識(shí)關(guān)聯(lián)的準(zhǔn)確性與知識(shí)更新的及時(shí)性;利用深度學(xué)習(xí)模型優(yōu)化向量存儲(chǔ)與檢索效率,實(shí)現(xiàn)多模態(tài)數(shù)據(jù)(文本、圖像、語音,包括方言語音)的快速檢索;基于自然語言處理技術(shù)動(dòng)態(tài)生成精準(zhǔn)的提示詞,支持多場(chǎng)景企業(yè)級(jí)知識(shí)庫(kù)的高精度問答與內(nèi)容生成。
6、跟蹤自然語言處理、計(jì)算機(jī)視覺、語音處理(包括方言識(shí)別)、深度學(xué)習(xí)等領(lǐng)域的國(guó)際技術(shù)演進(jìn),關(guān)注最新的算法突破、模型架構(gòu)創(chuàng)新、應(yīng)用場(chǎng)景拓展等信息,如Transformer架構(gòu)在自然語言處理和方言識(shí)別中的新變體、語音降噪的深度學(xué)習(xí)新方法等,推動(dòng)團(tuán)隊(duì)技術(shù)視野的持續(xù)擴(kuò)展。
任職要求:
1、博士學(xué)位,計(jì)算機(jī)科學(xué)、人工智能、自然語言處理、計(jì)算機(jī)視覺、語音信號(hào)處理或相關(guān)領(lǐng)域。編程基礎(chǔ)扎實(shí),熟悉掌握但不限于C/C++/Python/Java等編程語言中的一種或數(shù)種。
2、熟練掌握具備深度學(xué)習(xí)與機(jī)器學(xué)習(xí)能力:精通深度學(xué)習(xí)框架(如TensorFlow、PyTorch)和機(jī)器學(xué)習(xí)算法,具備豐富的模型設(shè)計(jì)、訓(xùn)練和調(diào)優(yōu)經(jīng)驗(yàn);熟悉Transformer架構(gòu)及其在自然語言處理和方言識(shí)別中的應(yīng)用。
3、熟練掌握自然語言處理(NLP)能力:深入理解自然語言處理的核心技術(shù),包括文本預(yù)處理、詞嵌入、序列標(biāo)注、機(jī)器翻譯、文本生成等;具備開發(fā)和優(yōu)化NLP模型的經(jīng)驗(yàn),特別是在方言識(shí)別和語音識(shí)別方面。
4、具備計(jì)算機(jī)視覺處理算法經(jīng)驗(yàn)優(yōu)先:熟練掌握計(jì)算機(jī)視覺技術(shù),包括目標(biāo)檢測(cè)、圖像分割、視頻分析等;有將計(jì)算機(jī)視覺與自然語言處理相結(jié)合的經(jīng)驗(yàn),能夠?qū)崿F(xiàn)圖像內(nèi)容的精準(zhǔn)描述與理解。
5、具備語音處理算法經(jīng)驗(yàn)優(yōu)化:熟悉語音信號(hào)處理的基本原理和方法,包括語音降噪、語音增強(qiáng)、語音識(shí)別等;有處理復(fù)雜噪聲環(huán)境下的語音信號(hào)的經(jīng)驗(yàn),能夠提升語音信號(hào)質(zhì)量以支持后續(xù)應(yīng)用。
6、具備多模態(tài)數(shù)據(jù)融合經(jīng)驗(yàn)優(yōu)先:有將計(jì)算機(jī)視覺、語音處理和自然語言處理相結(jié)合的經(jīng)驗(yàn),能夠?qū)崿F(xiàn)多模態(tài)數(shù)據(jù)的有效融合和創(chuàng)新應(yīng)用。
7、具備知識(shí)圖譜與知識(shí)庫(kù)經(jīng)驗(yàn)優(yōu)先:熟悉知識(shí)圖譜的構(gòu)建和優(yōu)化,能夠利用深度學(xué)習(xí)算法提高知識(shí)關(guān)聯(lián)的準(zhǔn)確性和知識(shí)更新的及時(shí)性;有構(gòu)建和優(yōu)化企業(yè)級(jí)知識(shí)庫(kù)的經(jīng)驗(yàn),能夠?qū)崿F(xiàn)多模態(tài)數(shù)據(jù)的快速檢索和高精度問答。
8、具備跨學(xué)科溝通能力,能夠?qū)?fù)雜技術(shù)問題轉(zhuǎn)化為業(yè)務(wù)價(jià)值,并與產(chǎn)品、市場(chǎng)團(tuán)隊(duì)高效協(xié)作;具備自我驅(qū)動(dòng)與抗壓能力及獨(dú)立開展研究的能力,能夠提出具有行業(yè)前瞻性的技術(shù)方向并推動(dòng)落地。