職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
崗位職責:
1、負責公司核心業(yè)務數(shù)據(jù)的爬取、清洗、標注、審核與編輯工作;
2、使用爬蟲工具高效獲取目標數(shù)據(jù),并進行數(shù)據(jù)整理和標注,用于訓練 AI 模型;
3、對模型輸出的數(shù)據(jù)進行審核和編輯修改,確保數(shù)據(jù)的準確性和可用性;
4、集中進行數(shù)據(jù)審核與編輯修改,確保數(shù)據(jù)數(shù)量與質(zhì)量滿足項目需求;
5、配合 AI 團隊進行模型測試、prompt 優(yōu)化、數(shù)據(jù)集構(gòu)建等工作;
6、理解人工智能和大模型訓練的語料需求,進行語料搜集和整理;
7、對收集到的原始數(shù)據(jù)進行初步篩選、格式標準化和文本標注,為模型訓練提供高質(zhì)量數(shù)據(jù)。
任職要求:
1、本科及以上學歷,計算機科學、電子信息、自動化等相關專業(yè);
2、熟練掌握 Python 等編程語言,具備扎實的編程基礎;
3、熟練運用爬蟲工具,能夠高效獲取目標數(shù)據(jù);
4、了解數(shù)據(jù)清洗、標注、審核等數(shù)據(jù)處理流程,并具備相關項目經(jīng)驗;
5、對人工智能和大模型訓練有基本了解,能夠理解語料需求和進行數(shù)據(jù)整理;
6、具備較強的數(shù)據(jù)敏感性,能夠發(fā)現(xiàn)數(shù)據(jù)中的問題和規(guī)律。
1、負責公司核心業(yè)務數(shù)據(jù)的爬取、清洗、標注、審核與編輯工作;
2、使用爬蟲工具高效獲取目標數(shù)據(jù),并進行數(shù)據(jù)整理和標注,用于訓練 AI 模型;
3、對模型輸出的數(shù)據(jù)進行審核和編輯修改,確保數(shù)據(jù)的準確性和可用性;
4、集中進行數(shù)據(jù)審核與編輯修改,確保數(shù)據(jù)數(shù)量與質(zhì)量滿足項目需求;
5、配合 AI 團隊進行模型測試、prompt 優(yōu)化、數(shù)據(jù)集構(gòu)建等工作;
6、理解人工智能和大模型訓練的語料需求,進行語料搜集和整理;
7、對收集到的原始數(shù)據(jù)進行初步篩選、格式標準化和文本標注,為模型訓練提供高質(zhì)量數(shù)據(jù)。
任職要求:
1、本科及以上學歷,計算機科學、電子信息、自動化等相關專業(yè);
2、熟練掌握 Python 等編程語言,具備扎實的編程基礎;
3、熟練運用爬蟲工具,能夠高效獲取目標數(shù)據(jù);
4、了解數(shù)據(jù)清洗、標注、審核等數(shù)據(jù)處理流程,并具備相關項目經(jīng)驗;
5、對人工智能和大模型訓練有基本了解,能夠理解語料需求和進行數(shù)據(jù)整理;
6、具備較強的數(shù)據(jù)敏感性,能夠發(fā)現(xiàn)數(shù)據(jù)中的問題和規(guī)律。
工作地點
地址:南京雨花臺區(qū)嘉環(huán)大廈
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
職位發(fā)布者
嘉環(huán)科技..HR
嘉環(huán)科技股份有限公司
-
通信/電信/網(wǎng)絡設備/增值服務
-
1000人以上
-
股份制企業(yè)
-
金筆街27號
相似職位
-
互聯(lián)網(wǎng)產(chǎn)品經(jīng)理(辦公協(xié)同方向)(020729) 面議應屆畢業(yè)生 不限維沃移動通信有限公司
-
devops產(chǎn)品經(jīng)理(020730) 面議應屆畢業(yè)生 不限維沃移動通信有限公司
-
資深圖形算法專家(020401) 面議應屆畢業(yè)生 不限維沃移動通信有限公司
-
游戲性能優(yōu)化專家(020403) 面議應屆畢業(yè)生 不限維沃移動通信有限公司
-
圖形顯示專家(020404) 面議應屆畢業(yè)生 不限維沃移動通信有限公司
-
CNC調(diào)機員 5000-7000元應屆畢業(yè)生 不限比亞迪股份有限公司

應屆畢業(yè)生
本科
最近更新
2257人關注
注:聯(lián)系我時,請說是在江蘇人才網(wǎng)上看到的。
