訂閱
糾錯(cuò)
加入自媒體

低學(xué)歷的印度數(shù)據(jù)標(biāo)簽工,正成為全球AI功臣

印度人工智能后臺(tái)

亞馬遜的MTurk在開(kāi)始限制非美國(guó)員工之前,曾是印度人尋找數(shù)據(jù)標(biāo)簽和注釋工作的熱門平臺(tái)。盡管后來(lái)取消了限制,但隨著企業(yè)客戶開(kāi)始更加重視數(shù)據(jù)安全,MTurk在數(shù)據(jù)標(biāo)簽商中的受歡迎程度有所下降。此外,包括Spare5、Cloudfactory和Figure Eight在內(nèi)的新眾包平臺(tái)也已經(jīng)進(jìn)入市場(chǎng),它們則更加關(guān)注注釋和標(biāo)簽市場(chǎng)。

Kolasseri說(shuō):“在創(chuàng)辦公司之前,我曾于2015年至2016年期間在MTurk平臺(tái)上工作過(guò),如今,仍然不斷有新的平臺(tái)出現(xiàn)。但是,由于企業(yè)客戶非常關(guān)注數(shù)據(jù)安全,尤其是考慮到許多數(shù)據(jù)集都是專有的,因此信任這些平臺(tái)上的工作人員成為他們面臨的更大挑戰(zhàn)。”

由前Flipkart員工Mall、Ajinkya Malasane和Akshay Kumar Lal所創(chuàng)立的Playment,則以一種略有不同的方式對(duì)待注釋和標(biāo)簽行業(yè)。

該公司為各種用例開(kāi)發(fā)了一系列注釋工具,并開(kāi)發(fā)了一個(gè)由受過(guò)這些工具培訓(xùn)的標(biāo)簽工和注釋工組成的眾包平臺(tái)。該公司直接與客戶或相關(guān)的信息技術(shù)服務(wù)公司進(jìn)行合作。

“要將原始數(shù)據(jù)轉(zhuǎn)換為帶注釋的結(jié)構(gòu)化數(shù)據(jù),你需要前端注釋工具、熟練且經(jīng)濟(jì)高效的人力資源。此外,由于處理數(shù)據(jù)的規(guī);,你還需要有合適的中間件來(lái)支持不同的工作流并管理遠(yuǎn)程人力資源,”Mall說(shuō)。

Playment的眾包平臺(tái)擁有30多萬(wàn)標(biāo)簽工和注釋工。其中,該公司認(rèn)為約有2.5萬(wàn)人是“高技能頂級(jí)玩家”。據(jù)Mall稱,這些人幾乎整天都在平臺(tái)上,平均月收入為2萬(wàn)至3萬(wàn)盧比。

Playment的大部分工作也來(lái)自國(guó)際客戶,其中包括三星、滴滴出行、阿里巴巴、Drive.a(chǎn)i和Continental AG,其中大部分都屬于自動(dòng)駕駛車輛領(lǐng)域。

iMerit的戰(zhàn)略則以員工為中心。其2000多名勞動(dòng)力中,約80%來(lái)自月收入低于100美元的家庭;其中大約一半是女性!拔覀兊纳鐣(huì)使命是在貧困社區(qū)和公司或工業(yè)較少的地區(qū)創(chuàng)造技術(shù)就業(yè)機(jī)會(huì)。我們?cè)诳萍籍a(chǎn)業(yè)稍低、科技就業(yè)機(jī)會(huì)較少的城市開(kāi)展業(yè)務(wù),” Natarajan說(shuō)道。

所謂的利他主義也有很好的商業(yè)意義。Natarajan表示:“我們的合作伙伴和辦公地點(diǎn),允許我們以非常經(jīng)濟(jì)高效的方式擴(kuò)大數(shù)據(jù)注釋和標(biāo)簽團(tuán)隊(duì),并為客戶提供高質(zhì)量的工作!

盡管iMerit的大部分業(yè)務(wù)都來(lái)自美國(guó)——客戶包括微軟、易趣和Tripadvisor——但其90%的數(shù)據(jù)注釋和標(biāo)簽工作是在印度完成的。

注釋自動(dòng)化

雖然各大公司正在開(kāi)發(fā)用于注釋的自動(dòng)化工具,但由于許多工作需要更為細(xì)致的定制注釋或標(biāo)簽工作,要想讓自動(dòng)化工具達(dá)到高精度還需要一段時(shí)間。

Natarajan說(shuō),與五年前人工智能還在區(qū)分貓和狗的不同相比,現(xiàn)在的人工智能需要處理更高級(jí)的工作!皺C(jī)器學(xué)習(xí)已經(jīng)向前發(fā)展,所以不再有人要求我們?yōu)楣泛拓堖M(jìn)行標(biāo)記。如今,每家公司都有定制的需求和非常細(xì)微的需求,所以不可能自動(dòng)實(shí)現(xiàn)這一點(diǎn),也不可能自動(dòng)給出數(shù)據(jù)并由一群匿名人士貼上標(biāo)簽!

他說(shuō),基于人工智能的自動(dòng)化注釋工具是不可避免會(huì)出現(xiàn)的,但它并不是一個(gè)威脅!白詣(dòng)化注釋工具本身就是經(jīng)過(guò)良好注釋訓(xùn)練出來(lái)的結(jié)果。當(dāng)你試圖解決一個(gè)問(wèn)題時(shí),這些工具只能把你帶到一定的水平,但是要超越這個(gè)水平,你還需要自定義注釋,”Natarajan說(shuō)。

當(dāng)然,加以一段時(shí)間,自動(dòng)化工具會(huì)變的足夠有效,從而能夠創(chuàng)建更好地?cái)?shù)據(jù)集!皬母L(zhǎng)遠(yuǎn)的角度來(lái)看,我們確實(shí)認(rèn)識(shí)到這個(gè)行業(yè)并不能永久存在。當(dāng)客戶成功時(shí),我們的任務(wù)就結(jié)束了,”Natarajan說(shuō)。“但我們也發(fā)現(xiàn),這也并不是一個(gè)100%肯定的事情,因?yàn)樗偸且粋(gè)持續(xù)不斷的學(xué)習(xí)和改進(jìn)的過(guò)程。此外,當(dāng)客戶轉(zhuǎn)向下一個(gè)問(wèn)題時(shí),一切又都從零開(kāi)始了!

換句話說(shuō),印度的數(shù)據(jù)標(biāo)簽和注釋公司尚未見(jiàn)頂,這一行業(yè)可能需要很長(zhǎng)時(shí)間才會(huì)走上業(yè)務(wù)流程外包的老路。

<上一頁(yè)  1  2  
聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)