人類和 AI 能夠“雙向奔赴”嗎? | 近匠(1)
在業(yè)界,每逢技術(shù)變革,就離不開技術(shù)布道者和科學(xué)家的身影,他們普及和闡釋技術(shù),在變革初期便預(yù)測(cè)未來技術(shù)的發(fā)展趨勢(shì)。成立于 1993 年的全球軟件及咨詢公司 Thoughtworks,匯聚了這些具有前瞻性眼光的人才。
“軟件開發(fā)教父”Martin Fowler 曾在加入 Thoughtworks 后這么評(píng)價(jià)它:這不是一家軟件開發(fā)公司,而是一場(chǎng)社會(huì)實(shí)驗(yàn)。公司創(chuàng)始人 Roy Singham 作為這場(chǎng)實(shí)驗(yàn)的發(fā)起者,試圖挑戰(zhàn)傳統(tǒng)的商業(yè)觀念,他認(rèn)為一家公司不能完全由高能力的人組成,而是需要有機(jī)結(jié)合不同能力的人,從而形成多元良性的商業(yè)環(huán)境。
2006 年,墨爾本。Kristan Vingrys 作為測(cè)試主管加入 Thoughtworks。在進(jìn)入管理團(tuán)隊(duì)之前,他花了七年時(shí)間通曉「分布式敏捷」的開發(fā)方法,先后奔赴 Thoughtworks 的澳洲和英國擔(dān)任高管,并在今年接管了全新啟動(dòng)的亞太區(qū)業(yè)務(wù),希望通過創(chuàng)新技術(shù)實(shí)現(xiàn)每一位客戶的使命。
毫無疑問,Kristan 屬于“高能力的人”。時(shí)至今日,他已經(jīng)擁有超過 20 年的技術(shù)領(lǐng)導(dǎo)經(jīng)驗(yàn),在歐亞兩洲四處奔波的他擁有多地域的管理開發(fā)經(jīng)驗(yàn),對(duì)于全球化團(tuán)隊(duì)的管理得心應(yīng)手。然而,Kristan 的座右銘卻是“過去的經(jīng)驗(yàn)會(huì)影響我對(duì)任何新事物的第一印象”。
沒有經(jīng)驗(yàn),我們就不能合理判斷一項(xiàng)技術(shù);依賴經(jīng)驗(yàn),我們可能會(huì)失去創(chuàng)新的能力。那么,開發(fā)者究竟該如何運(yùn)用自己的「經(jīng)驗(yàn)」?CSDN《近匠》特派記者奔赴 Thoughtworks 國內(nèi)最大辦公室:古城西安,面對(duì)面采訪了時(shí)隔 4 年再次來華的 Thoughtworks 亞太區(qū)總裁 Kristan Vingrys,一同領(lǐng)略這位技術(shù)預(yù)言者的前瞻思維。
用現(xiàn)有的「經(jīng)驗(yàn)」 評(píng)估 ChatGPT 為時(shí)過早
每六個(gè)月左右,Thoughtworks 都會(huì)發(fā)布一期技術(shù)雷達(dá),它記錄了開發(fā)者感興趣的最新技術(shù)趨勢(shì)和潛在風(fēng)險(xiǎn)。技術(shù)雷達(dá)涵蓋了前沿的技術(shù),并被分為數(shù)百個(gè)條目,Thoughtworks 按照象限和圓環(huán)對(duì)條目進(jìn)行分類(如圖 1 所示)。
圖 1 技術(shù)雷達(dá)的四種生命周期
象限代表?xiàng)l目的不同種類。圓環(huán)顯示出條目所處在的生命周期:采納、試驗(yàn)、評(píng)估和暫緩。
《新程序員》:技術(shù)雷達(dá)是怎么做出來的?你們要如何評(píng)估這些技術(shù)的重要性、潛在影響和風(fēng)險(xiǎn)?
Kristan:新的一期技術(shù)雷達(dá)來自世界各地的 21 位專家針對(duì)每個(gè)熱門應(yīng)用程序中的技術(shù)的評(píng)估。在小組開會(huì)之前,這些專家與當(dāng)?shù)丶夹g(shù)人員舉行會(huì)議,以收集不同角度的見解。技術(shù)雷達(dá)的誕生基于他們的實(shí)際經(jīng)驗(yàn)和對(duì)技術(shù)的使用,而不僅僅是閱讀或思考。
《新程序員》:決策由 21 位專家作出,那網(wǎng)絡(luò)評(píng)論或社會(huì)輿論會(huì)影響結(jié)果嗎?
Kristan:輿論總是會(huì)起到影響作用,但最終決定還是由專家小組作出。技術(shù)雷達(dá)所有的貢獻(xiàn)都來自基層工作者,而專家是最終決策者。
《新程序員》:本期技術(shù)雷達(dá)加入了最新熱點(diǎn):ChatGPT(如圖 2 所示)。它在技術(shù)雷達(dá)中被列為「評(píng)估」而不是更為成熟的「試驗(yàn)」級(jí)別。您認(rèn)為它還面臨著哪些風(fēng)險(xiǎn)和挑戰(zhàn)?
Kristan:與其說風(fēng)險(xiǎn)和挑戰(zhàn),倒不如說全世界目前都缺乏充足的實(shí)際應(yīng)用經(jīng)驗(yàn)來對(duì) ChatGPT 進(jìn)行全面評(píng)估。人類從未有過和大語言模型進(jìn)行對(duì)話式交互的體驗(yàn),這需要更多的時(shí)間觀察。我們的專家團(tuán)隊(duì)使用 ChatGPT 做過許多概念驗(yàn)證,但在日常生產(chǎn)環(huán)境中的使用還比較有限。
圖 2 技術(shù)雷達(dá):ChatGPT
《新程序員》:在技術(shù)雷達(dá)中,領(lǐng)域特定的大語言模型同樣被列為「評(píng)估」級(jí)的技術(shù)(如圖 3 所示),它是否面臨著與通用語言模型相同的倫理和法律問題?例如,它是否存在對(duì)特定社會(huì)群體的歧視性?像是把 "doctor" 和 "programmer" 這樣的詞語與男性聯(lián)系在一起,或把 "nurse" 和 "homemaker" 與女性聯(lián)系在一起。
Kristan:我認(rèn)為任何語言模型、任何代碼都有可能出現(xiàn)偏見。其中一些偏見可能是有意識(shí)的,但在大多數(shù)情況下,這些偏見其實(shí)是無意識(shí)產(chǎn)生的。你提到的例子里,人們無意識(shí)地將某個(gè)角色與特定性別相關(guān)聯(lián),這種偏見會(huì)自然地被構(gòu)建到模型當(dāng)中。
這是一個(gè)需要首先在文本中解決的問題。我們需要有人來質(zhì)疑那些無意識(shí)的偏見,分析和處理帶有偏見的文本資料,因?yàn)檫@些偏見往往是難以察覺的,且不同的人會(huì)有不同的無意識(shí)偏見。所以,如果工作團(tuán)隊(duì)具備多元化的思想,就更有可能發(fā)現(xiàn)并解決這些特定的偏見。
圖 3 技術(shù)雷達(dá):領(lǐng)域特定的大型語言模型
《新程序員》:您對(duì) ChatGPT 的商業(yè)化有哪些看法?GitHub Copilot 會(huì)是一個(gè)成功案例嗎?
Kristan:這兩者都值得我們的持續(xù)關(guān)注。目前可能存在一些過度炒作,但這在新技術(shù)出現(xiàn)時(shí)是常見的情況?;叵胍荒昵?,很多人都幻想過谷歌眼鏡會(huì)開拓新的數(shù)字宇宙,我們將在智能世界里行走,所有的一切都要依靠谷歌眼鏡來實(shí)現(xiàn)。技術(shù)趨勢(shì)的發(fā)展就是這樣,我們會(huì)看到無數(shù)炒作,然后逐漸回歸到現(xiàn)實(shí)。
AI 帶來的變革必定會(huì)打破現(xiàn)有模式,并改變企業(yè)的解決方案,同時(shí)影響我們對(duì)代碼和技術(shù)問題的思考方式。因此,我們需要持續(xù)關(guān)注正在發(fā)生的變化,并繼續(xù)觀察和關(guān)注這些技術(shù)的發(fā)展。
《新程序員》:但 Copilot 出現(xiàn)過一些嚴(yán)重的隱私和安全問題,這是否為 ChatGPT 的商業(yè)化以及你們對(duì)它的評(píng)估帶來了不小的影響?
Kristan:這也是我們正在重點(diǎn)關(guān)注的問題,也是一個(gè)需要解決的問題,只有解決了它才能更廣泛地應(yīng)用這些技術(shù)。目前,使用 ChatGPT 生成代碼需要獲得許可。為了解決代碼重復(fù)使用、盜用和信息泄露可能帶來的工程和安全威脅問題,微軟正在創(chuàng)建更多的私有實(shí)例。
所以,我認(rèn)識(shí)的很多高管都在思考兩件事:如果我不跟隨這場(chǎng)潮流,我會(huì)落后嗎?如果我也加入了 AIGC 浪潮,被黑客攻擊了該怎么辦?總之,這些風(fēng)險(xiǎn)問題可能要靠微軟自己解決了。
《新程序員》:只要是真正有用的產(chǎn)品,用戶還是會(huì)頂著隱私安全的風(fēng)險(xiǎn)去使用它們。Facebook 和 iPhone 曾遭受過極其嚴(yán)重的黑客攻擊,但人們?nèi)匀辉敢馐褂盟鼈儭?/span>
Kristan:人們確實(shí)會(huì)為真正有用的產(chǎn)品付費(fèi),但他們現(xiàn)在使用這些軟件也更加謹(jǐn)慎了。而且,個(gè)人信息和企業(yè)信息的性質(zhì)不同。對(duì)于個(gè)人用戶來說,他們會(huì)評(píng)估自己信息被竊取的風(fēng)險(xiǎn),并更關(guān)注實(shí)用性。而對(duì)于組織來說,發(fā)生入侵事件意味著面臨重大損失,輕則數(shù)百萬美元的損失、停業(yè)等,重則面臨數(shù)十億美元的罰款和訴訟。所以,個(gè)人和組織分別存在著不同的風(fēng)險(xiǎn)層級(jí)。
《新程序員》:除了技術(shù)雷達(dá),你們還考慮過將 ChatGPT 用于其他工作嗎?
Kristan:目前,我們還在努力確保自己對(duì) ChatGPT 有清晰的認(rèn)識(shí)和理解。Thoughtworks 將進(jìn)行大量的實(shí)驗(yàn),和客戶合作進(jìn)行概念驗(yàn)證和黑客馬拉松等項(xiàng)目。在我們積累了一些實(shí)際應(yīng)用經(jīng)驗(yàn)之后,我們可能會(huì)在未來的工作計(jì)劃中加入更多的人工智能。
我們已經(jīng)為員工提供了許多關(guān)于 ChatGPT 的指導(dǎo)文章,但在我們真正將大模型用于解決客戶的實(shí)際商業(yè)問題并投入到實(shí)際生產(chǎn)之前,我們將繼續(xù)把 ChatGPT 列為「評(píng)估」級(jí)別。
《新程序員》:想必 ChatGPT 能對(duì)你們的分析工作起到很大幫助。
Kristan:ChatGPT 并不能總是提供正確的信息或答案。它無法確定什么是正確的信息,甚至無法對(duì)同一個(gè)問題提供穩(wěn)定的答案。因此,數(shù)據(jù)集以及其所經(jīng)歷的訓(xùn)練過程對(duì)于大語言模型的實(shí)際表現(xiàn)非常重要,這也決定了我對(duì) ChatGPT 可靠性的最終評(píng)價(jià)。當(dāng)然,ChatGPT 肯定會(huì)提高分析工作的效率,因?yàn)樗軌蚋斓靥峁┐鸢浮?/span>
我想分享一件在澳大利亞工作群里發(fā)生的趣事:曾有個(gè)人詢問 ChatGPT,mayonnaise(蛋黃醬)一詞中有多少個(gè)“n”?它回答說,四個(gè)(見圖 4)。然后他對(duì)著 ChatGPT 繼續(xù)說,你能給我展示 mayonnaise 中四個(gè)“n”的位置嗎?結(jié)果,ChatGPT 真的回答了 mayonnaise 這個(gè)單詞四種不同的拼寫方式。雖然這四個(gè)拼寫都是真實(shí)存在的,但 ChatGPT 還是弄錯(cuò)了那個(gè)人本來想問的問題——mayonnaise 里面應(yīng)該有兩個(gè)字母“n”。
圖 4 雖未完全復(fù)刻,但筆者還是成功讓 ChatGPT 介紹了“蛋黃醬的四種寫法”
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。