亚洲精品成人网线在线播放va_丰满人妻妇伦又伦精品国产_全免费a级毛片免费看视频_麻豆一区二区三区精品视频_亚洲综合在线一区二区三区

展開

阿法狗來炒股 人腦算得過機(jī)器人

      對于人工智能阿法狗,金融圈恐慌不是一兩天了。如果用阿法狗來炒股,新一代的“股神”非其莫屬!
??
??最新一代的AlphaGo Zero(阿爾法元)已經(jīng)根本不用學(xué)習(xí)幾千幾萬盤人類的棋局,而是摸清掌握了圍棋規(guī)則,它用升級版的自己和原來的自己對壘,并以100:0的成績擊敗了阿爾法狗。
??
??在人工智能的快速發(fā)展引發(fā)世界一片驚嘆之時,近日美國新出了一支交易所交易基金,由機(jī)器人挑選股票,而且到目前為止人類都不是它的對手。
??
??全球首只機(jī)器人選股ETF誕生
??
??10月18日,EquBot LLC、ETF Managers Group共同推出了全球第一只應(yīng)用人工智能、機(jī)器學(xué)習(xí)進(jìn)行投資的ETF:AI Powered Equity ETF(AIEQ.US)。
??
??雖然10月18日才開始交易,這支代碼為AIEQ的人工智能選股ETF卻已經(jīng)發(fā)掘出了一些大熱的股票。該基金在ibm的Watson平臺上運(yùn)行自營的量化模型。
??
??數(shù)據(jù)顯示,自10月18日啟動以來,該ETF已經(jīng)提供了0.83%的回報率,而同期標(biāo)普500指數(shù)上漲0.48%,納斯達(dá)克綜合指數(shù)漲幅為-0.42%。
??
??數(shù)據(jù)來源:東方財富網(wǎng)
??
??據(jù)悉,AIEQ的根本技術(shù)就是持續(xù)不斷的分析美國掛牌股票,并且每天處理大約100萬則的企業(yè)公告、季度財報以及新聞等。EquBot LLC執(zhí)行長Chida Khatua指出,EquBot AI科技與Watson的攜手合作等同打造出一支全天24小時、365天全年無休的股票研究分析團(tuán)隊。
??
??這一基金推出之際,先進(jìn)技術(shù)和大數(shù)據(jù)組成的洶涌大潮正以一浪高過一浪的勢頭沖向華爾街。
??
??一些大型對沖基金都紛紛開始用人工智能取代基金經(jīng)理,讓它們來協(xié)助分析師研究業(yè)績報告和推薦股票。
??
??摩根大通利用AI開發(fā)了一款金融合同解析軟件。原先律師和貸款人員每年需要360000小時才能完成的工作,這款軟件只需幾秒就能完成。而且錯誤率大大降低,還可以24小時工作。
??
??高盛的交易大廳更是縮影。2000年高盛在紐約總部的美國現(xiàn)金股票交易柜臺雇傭了600名交易員,今天只剩下兩名交易員。減少交易員的數(shù)量能幫助公司節(jié)省大量成本。截止去年9月,高盛已裁員超400人,主要是證券部門的交易員及銷售人員。
??
??德國商業(yè)銀行,到 2020年他們將會將銀行中 80%的工作都數(shù)碼化、自動化,最終將會裁掉9600名員工。
??
??荷蘭的ING銀行,宣布一個可以讓他們在未來省下近9億歐元的“數(shù)碼轉(zhuǎn)換”計劃:先砍掉5800名員工,占員工總數(shù)13%;未來再視情況讓另外1200名員工轉(zhuǎn)職或是裁掉。
??
??瑞銀集團(tuán)8年前的交易大廳何其壯觀,但現(xiàn)在交易大廳成了空蕩蕩的。
??
??人工智能技術(shù)在金融交易領(lǐng)域最顯而易見的體現(xiàn)就是量化投資。目前,AI在全球?qū)_基金行業(yè)的運(yùn)用已相對成熟,在中國,從業(yè)績透明的公募量化產(chǎn)品來看,量化產(chǎn)品的業(yè)績已普遍跑贏指數(shù)收益。
??
??據(jù)調(diào)研公司LCH在今年初出具的調(diào)研報告,美國業(yè)績排前20的對沖基金,包括橋水基金、索羅斯基金,全部采用計算機(jī)根據(jù)算法自動交易。
??
??或許最終會有這一天,股市在幾十只或幾百只“炒股阿爾法狗”之間進(jìn)行,而交易員成為歷史。
??
??金融數(shù)據(jù)服務(wù)商Kensho創(chuàng)始人預(yù)計,到2026年,有33%-50%的金融業(yè)工作人員會失去工作。Kensho開發(fā)的程序分析工作只需一分鐘,而拿著高達(dá)35萬美元年薪的分析師們,需要40小時才能完成,而且質(zhì)量還不一定比機(jī)器高。
??
??不過,也有金融從業(yè)人員在雪球上撰文指出,假設(shè)機(jī)器人炒股比例將大規(guī)模增加,人工智能是否會讓市場更理性也是一個問號。
??
??盡管人有情緒,可能放大市場危機(jī),但是人工智能是否會因為比如技術(shù)分析判斷的趨同,導(dǎo)致某個時間節(jié)點(diǎn),所有智能炒股策略都理性的往一個方向交易,讓市場更動蕩呢?
??
??有一天,人工智能不但交易起來得心應(yīng)手,而且自我學(xué)習(xí)能力已經(jīng)很強(qiáng),可以自己調(diào)整些投資策略。那么很可能就是大量基金公司都是玩人工智能,但是問題來了,大家都人工智能化了,都賺錢嗎?
??
??顯然不是,市場又將是各類人工智能技術(shù)和投資策略的競爭,說白了,很可能有回到如今主動性管理基金的狀態(tài),人工智能也分三六九等,很可能今年這款人工智能技術(shù)大賺,明年又大虧,投資者還是感覺沒譜。
??
??助手還是取代者?
??
??人工智能在金融領(lǐng)域到底是助手還是取代者?
??
??對此,渣打銀行中國財富管理部董事總經(jīng)理梁大偉近期對第一財經(jīng)記者表示,在深度學(xué)習(xí)方面,通過大數(shù)據(jù)、人工智能去做信息整合和分析的時候,這些人工智能和大數(shù)據(jù)在我們做出投資決定和資產(chǎn)配置方面,確實省去很多的時間,而且更精準(zhǔn)。
??
??但人工智能只是幫助投資顧問投資的技術(shù)助手,并不能完全取代他們的工作。
??
??渣打銀行梁大偉:
??
??智能投顧并不會完全取代投資顧問,例如,去年8月渣打推出了國內(nèi)外資行首個手機(jī)交易平臺,在手機(jī)平臺上就可以直接給投資者提出建議,并且附上詳細(xì)的介紹。
??
??但是,依然有超過90%的客戶在做出投資決定之前,與自己的客戶經(jīng)理或者投資顧問進(jìn)行溝通,投資顧問都會根據(jù)實際情況給予相應(yīng)理財建議以及調(diào)整資產(chǎn)配置。而智能投顧技術(shù)則實現(xiàn)投顧業(yè)務(wù)流暢化、財富管理數(shù)字化、跟蹤資產(chǎn)組合表現(xiàn)等功能,以輔助投顧更好服務(wù)于客戶。
??
??至于中國是否會出現(xiàn)人工智能機(jī)器人選股的情況,梁大偉認(rèn)為,機(jī)構(gòu)在發(fā)展智能投顧的時候,很容易把海外的經(jīng)驗搬到境內(nèi)作為參考,但問題是,在海外,在美國,他們智能投顧大部分都是通過公募基金或者ETF進(jìn)行資產(chǎn)配置,他們的ETF幾乎可以覆蓋所有的大類資產(chǎn)。但是在中國境內(nèi),不管是市場的廣度還是深度,都跟美國市場有很大差異。
??
??目前,中國的人工智能發(fā)展已經(jīng)進(jìn)入了世界前列,擁有的三大優(yōu)勢主要體現(xiàn)在,人才、技術(shù)和基礎(chǔ)設(shè)施方面,但相比于美國等發(fā)達(dá)國家和經(jīng)濟(jì)體仍然存在差距。
??
??博時基金基金經(jīng)理桂征輝也提出,目前,中國的人工智能大數(shù)據(jù)在金融投資領(lǐng)域的確有了初步的成果,但這些成果還需要時間的檢驗,尤其是在商業(yè)模式、與傳統(tǒng)企業(yè)機(jī)構(gòu)合作方式以及監(jiān)管方式等方面,還處于摸索階段。
??
??砸了40%的行業(yè)的飯碗 卻讓這些人身價跳漲!
??
??雖然這一切還只是開始,但由于科技的進(jìn)步,我們身邊的業(yè)態(tài)已經(jīng)發(fā)生變化。
??
??以下這些是正在發(fā)生的事情:
??
??阿里巴巴推出無人超市,刷臉進(jìn)店結(jié)算,拿了商品就可以出門,智能化的操作已經(jīng)在搶超市收銀員的飯碗;
??
??京東全球首個全流程無人倉建成,效率是人工的4-5倍,未來還要推出無人快遞,未來快遞員、司機(jī)又將失業(yè);
??
??富士康生產(chǎn)線已部署4萬臺機(jī)器人,穩(wěn)步推進(jìn)“百萬機(jī)器人”計劃,機(jī)器人正逐步替代流水線工人;
??
??今年8月九寨溝地震發(fā)生的18分鐘后,中國地震臺網(wǎng)的機(jī)器,寫了篇新聞稿,用時25秒;今日頭條上,一個名叫小明的機(jī)器人截至今年5月已完成5139篇體育類報道,總閱讀超1800萬;
??
??摩根大通開發(fā)了一款金融合同解析軟件COIN。原先律師和貸款人員每年需要360000小時才能完成的工作,COIN只需幾秒就能完成。
??
??你沒看錯,讓流水線工人、收銀員、倉庫管理員、快遞員、司機(jī)、新聞記者、交易員、會計師……讓這些職業(yè)者丟掉飯碗的正是人工智能AI。
??
??人工智能正以睥睨世界的心態(tài),幾乎滲入肌理地威脅著傳統(tǒng)行業(yè),但同時,卻使這些行業(yè)的身價水漲船高。
??
??近日,一份2018屆互聯(lián)網(wǎng)校招高薪清單在網(wǎng)絡(luò)流傳,其中互聯(lián)網(wǎng)企業(yè)技術(shù)類崗位的年薪水平令人咋舌!人工智能帶火了研究深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、人工智能等崗位,其應(yīng)屆畢業(yè)生薪資,據(jù)說年薪25萬只是白菜價 ,30萬的年薪已是常態(tài)。
??
??由于人工智能、深度學(xué)習(xí)等領(lǐng)域存在較大的人才缺口,包括谷歌中國、微軟、google、騰訊、大疆、百度等互聯(lián)網(wǎng)科技企業(yè),為應(yīng)屆畢業(yè)生開出了許多人奮斗四五年都達(dá)不到的年薪。
??
??在國內(nèi),谷歌中國智能崗位招收的畢業(yè)生年薪最高,達(dá)56萬元人民;其次是微軟的算法工程師崗位,年薪51萬;第三是谷歌的算法工程師崗位,年薪50萬。其實,這還不算什么。更可怕的是在美國硅谷,據(jù)李開復(fù)透露,做深度學(xué)習(xí)的人工智能博士生,現(xiàn)在一畢業(yè)就能拿到年薪200萬到300萬美元,合計1300萬到1950萬人民幣的錄用通知!
??
??由此可見,人工智能人才需求在世界范圍內(nèi),有多么的供需不平衡。
??
??此前國務(wù)院近期印發(fā)的《新一代人工智能發(fā)展規(guī)劃》指出:高等院校在加強(qiáng)專業(yè)建設(shè)之外,還可通過校企聯(lián)合辦學(xué)的方式來培養(yǎng)人工智能人才,豐富人工智能教育的形式,并推動人工智能教育加速發(fā)展。此外,人工智能還被寫入政府工作報告。
??
??毫無疑問,人工智能正在改變我們的生活,甚至有國外學(xué)者預(yù)測,十年之內(nèi),AI將變得足夠聰明,并消滅40%以上的職業(yè)。
??
??對此,人工智能所帶來的啟示是:要么變,要么被改變。無論業(yè)內(nèi)人士,還是一般投資者,保持個人提高和調(diào)整總是應(yīng)該主動去做的。
??
??從阿爾法狗元(AlphaGo Zero)的誕生看終極算法的可能性
??
??作者:杜圣東
??
??1923年,愛因斯坦在他的諾貝爾得獎感言中說到:“我欲探索一個統(tǒng)整理論的理智思維,是無法滿足于存在有兩個本質(zhì)彼此完全獨(dú)立的領(lǐng)域之假設(shè)”。這句話有點(diǎn)拗口,主要意思是,愛因斯坦認(rèn)為自然科學(xué)中“統(tǒng)一”的概念或許是一個最基本的法則。后來直到去世,愛因斯坦都在致力于尋求一種能將引力場與電磁場,相對論與量子論統(tǒng)一起來的統(tǒng)一場理論。后來霍金在《時間簡史》中也指出了大統(tǒng)一理論的可能性 ,他認(rèn)為也許會發(fā)現(xiàn)大統(tǒng)一理論。雖然迄今為止統(tǒng)一場論都尚未得到發(fā)現(xiàn)驗證,但對常人的理解來講,通過一個簡單美妙的公式就能預(yù)測和描述宇宙萬事萬物,不異于天方夜譚。
??
??同樣,在人工智能領(lǐng)域,要真正實現(xiàn)專家們口中的超人工智能(SuperAI),也還有極漫長的路要走。有沒有一種終極算法,能讓人類一步到位設(shè)計出超人類的AI系統(tǒng)?這跟愛因斯坦提出的統(tǒng)一場論一樣,還面臨著理論與設(shè)計實現(xiàn)的巨大挑戰(zhàn)。
??
??今年LeCun(facebook AI實驗室負(fù)責(zé)人)曾說到:“絕大多數(shù)人類和動物的學(xué)習(xí)方式是非監(jiān)督學(xué)習(xí)。如果智能是個蛋糕,非監(jiān)督學(xué)習(xí)才是蛋糕主體,監(jiān)督學(xué)習(xí)只能說是蛋糕上的糖霜奶油,而強(qiáng)化學(xué)習(xí)只是蛋糕上點(diǎn)綴的櫻桃。
??
??現(xiàn)在我們知道如何制作“糖霜奶油”和上面的“櫻桃”, 但并不知道如何制作蛋糕主體。我們必須先解決關(guān)于非監(jiān)督學(xué)習(xí)的問題,才能開始考慮如何做出一個真正的AI。這還僅僅是我們所知的難題之一。更何況那些我們未知的難題呢?”正如LeCun所說,未來解碼人類學(xué)習(xí)方式的關(guān)鍵突破性技術(shù),很可能會由無監(jiān)督學(xué)習(xí)來完成,因為無監(jiān)督才是人類和動物學(xué)習(xí)的關(guān)鍵模式,嬰幼兒通過少量有監(jiān)督學(xué)習(xí)訓(xùn)練之后,在后續(xù)幾十年的成長過程中,能夠觀察并發(fā)現(xiàn)世界的內(nèi)在結(jié)構(gòu)和獲得經(jīng)驗知識,都是一種無監(jiān)督的自發(fā)主動的學(xué)習(xí)模式,而不是像小時候被父母告知每項事物的名稱和意義。
??
??要攻破無監(jiān)督學(xué)習(xí)這座AI堡壘,貌似在短期內(nèi)不可能。但就在昨天,Nature發(fā)布了Deepmind關(guān)于阿爾法狗元(AlphaGoZero)的文章,在科技圈引起了不小轟動,貌似LeCun口中的“櫻桃”(強(qiáng)化學(xué)習(xí))大放異彩,使得AI向無監(jiān)督自我學(xué)習(xí)進(jìn)化又邁出了一大步。本文就來談?wù)?,要實現(xiàn)SuperAI和終極算法的可能性,兼論阿爾法狗元從0到1的重大意義,貌似開了一個好頭。
??
??阿爾法狗元(AlphaGo Zero)的橫空出世
??
??最近幾年,人工智能的研究和應(yīng)用,從語音識別、圖像分類到基因組學(xué)和藥物發(fā)現(xiàn)等多個領(lǐng)域取得了快速進(jìn)展。這得益于大數(shù)據(jù)和深度學(xué)習(xí)的有力支持。可以這么講,這波AI大躍進(jìn)多是數(shù)據(jù)驅(qū)動的AI,沒有大數(shù)據(jù)的喂養(yǎng),沒有GPU算力的普及化,就沒有深度學(xué)習(xí)的成功。數(shù)據(jù)驅(qū)動的AI離不開大數(shù)據(jù),大數(shù)據(jù)與AI形成一種共生關(guān)系:
??
??一方面,AI基礎(chǔ)理論技術(shù)的發(fā)展為大數(shù)據(jù)機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘提供了更豐富的模型和算法,如深度網(wǎng)絡(luò)衍生出的一系列相關(guān)技術(shù)(深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)、對抗學(xué)習(xí)等)和方法;
??
??另一方面,大數(shù)據(jù)為AI的發(fā)展提供了新的動力和燃料,數(shù)據(jù)規(guī)模大了之后,傳統(tǒng)機(jī)器學(xué)習(xí)算法面臨巨大挑戰(zhàn),要做并行化、要加速、要改進(jìn)。當(dāng)前的弱AI應(yīng)用都遵從這一技術(shù)路線,大數(shù)據(jù)、深度學(xué)習(xí)和GPU計算居功至偉。
??
??然而,這些利用了大量人力、物力資源和海量數(shù)據(jù)的AI系統(tǒng)。卻很難擴(kuò)展到通用AI的程度,更不必說超AI了,比如ImageNet的上千萬張圖片訓(xùn)練出的AI系統(tǒng),卻無法對醫(yī)療和自動駕駛領(lǐng)域產(chǎn)生同樣重大的作用。需要另起爐灶,重新花大量人力物力進(jìn)行針對性的數(shù)據(jù)標(biāo)注和AI系統(tǒng)建設(shè)。
??
??類似這些問題,對人類歷史經(jīng)驗數(shù)據(jù)太過依賴,而這種大數(shù)據(jù)知識成本昂貴,或不可靠,或根本無法使用。因此,Super AI的研究必須要能繞過大數(shù)據(jù),通過解碼人腦智能學(xué)習(xí)機(jī)理,才能創(chuàng)造出一種終極算法。而阿爾狗元的橫空出世,向我們展現(xiàn)了邁向這一目標(biāo)的可能性。不需要上百萬盤歷史棋譜數(shù)據(jù),僅訓(xùn)練3天(自己左右互搏490萬棋局),只需要4片TPU就戰(zhàn)勝了舊版AlphaGo 系統(tǒng),而比分是100:0;舊版阿爾法狗采用了48片TPU,需要花幾個月學(xué)習(xí)幾千萬盤棋局才完全戰(zhàn)勝人類。以致于柯潔面對新版的阿爾法狗元,發(fā)表了如下無力吐槽。
??
??阿爾法狗元的智能解碼
??
??阿爾狗元為什么能在如此短的時間,有如此驚人的進(jìn)步?下面我們來分析下新版阿爾法狗元的智能“級數(shù)”。關(guān)于智能,古今中外許多哲學(xué)家、腦科學(xué)家都一直在努力探索和研究,但至今仍然沒有完全了解,可以說理解甚少。所以有,智能的發(fā)生與物質(zhì)的本質(zhì)、宇宙的起源、生命的本質(zhì)一起被列為自然界四大奧秘。隨著腦科學(xué)、神經(jīng)心理學(xué)等研究的進(jìn)展,我們對人腦的結(jié)構(gòu)和功能有了初步認(rèn)識,但對整個神經(jīng)系統(tǒng)的內(nèi)部結(jié)構(gòu)和作用機(jī)制,特別是大腦的功能原理卻知之甚少。在這樣一個大背景下,深度學(xué)習(xí)的階段性成功,可謂是誤打誤撞。深度學(xué)習(xí)也被很多專家稱為類腦學(xué)習(xí),其實不夠嚴(yán)謹(jǐn),最多算是類人腦視覺皮層學(xué)習(xí),簡單的神經(jīng)元連接結(jié)構(gòu)離完全模擬人腦還差十萬八千里。但換個角度看,才入門就有了奇效?解碼人腦的學(xué)習(xí)記憶機(jī)制才能設(shè)計出終極算法么?這個答案仁者見仁智者見智,且看后文分解。
??
??舊版AlphaGo采用的核心技術(shù)是基于深度學(xué)習(xí)+強(qiáng)化學(xué)習(xí)+蒙特卡洛樹決策的組合式學(xué)習(xí)方法,也可以說是學(xué)習(xí)框架,其已經(jīng)摸到了類腦學(xué)習(xí)的大門,其學(xué)習(xí)下棋分為三個階段:
??
??(1)通過對歷史棋譜的深度學(xué)習(xí)完成策略網(wǎng)絡(luò)的構(gòu)建,采用深度學(xué)習(xí)技術(shù)訓(xùn)練一種有監(jiān)督學(xué)習(xí)型走棋策略網(wǎng)絡(luò),類似于我們的觀察學(xué)習(xí)獲得的第一反應(yīng)。
??
??(2)通過自我對戰(zhàn)強(qiáng)化學(xué)習(xí)來提高博弈水平,采用強(qiáng)化學(xué)習(xí)技術(shù)來優(yōu)化先前的走棋策略網(wǎng)絡(luò),通過自我博弈的強(qiáng)化學(xué)習(xí)迭代結(jié)果,來提升前面的策略網(wǎng)絡(luò)。即與之前的“自己”不間斷訓(xùn)練以提高下棋的水平,這個過程有點(diǎn)類似于人類的鞏固學(xué)習(xí)和理解貫通階段。
??
??(3)通過深度回歸學(xué)習(xí)構(gòu)建估值網(wǎng)絡(luò),用來預(yù)測自我博弈強(qiáng)化學(xué)習(xí)數(shù)據(jù)集里局面的預(yù)期結(jié)果,即預(yù)測那個策略網(wǎng)絡(luò)的局面會成為贏家。結(jié)合蒙特卡洛樹(MCTS)搜索壓縮搜索空間,降低了搜索時間復(fù)雜度, MCTS決策有效結(jié)合了策略網(wǎng)絡(luò)和估值網(wǎng)絡(luò),類似于人類的判斷決策過程。
??
??而新版的AlphaGo Zero做了較大改進(jìn),一是跳過了第一個階段,完全拋棄了歷史棋譜的學(xué)習(xí),訓(xùn)練學(xué)習(xí)從無到有;二是改進(jìn)了原強(qiáng)化學(xué)習(xí)的形式,只使用一個神經(jīng)網(wǎng)絡(luò)而不是兩個神經(jīng)網(wǎng)絡(luò),通過將這個神經(jīng)網(wǎng)絡(luò)與MCTS搜索算法相結(jié)合,通過左右互搏自娛自樂,按設(shè)定的走棋規(guī)則隨機(jī)開始圍棋小白式的學(xué)習(xí),靠激勵、懲罰的強(qiáng)化學(xué)習(xí)機(jī)制來糾正學(xué)習(xí)過程中的錯誤,調(diào)整提升學(xué)習(xí)能力。這種機(jī)制已經(jīng)很接近完全無監(jiān)督學(xué)習(xí),擺脫了對人類標(biāo)注數(shù)據(jù)的依賴(歷史棋譜)。這也是為什么阿爾法狗元能以100:0戰(zhàn)勝舊版阿爾法狗的原因,只靠模仿和師傅教是很難在較短時間內(nèi)超越師傅的,而周伯通能成為武林頂尖高手,就是因為他的武功只靠原創(chuàng)從不模仿。
??
??DeepMind AlphaGo項目首席研究員大衛(wèi).西爾弗(David Silver,左)與CEO德米斯.哈比斯(Demis Hassabis)
??
??有點(diǎn)扯遠(yuǎn)了?;氐秸},對于阿爾法狗元,我們先提兩個問題:
??
??(1)阿爾法狗元既然能有如此進(jìn)步,為什么創(chuàng)始人在原來沒有想到?
??
??(2)阿爾法狗元還有一個梗,使其還有較大的智能瓶頸,這個瓶頸是什么?
??
??第一個問題很好理解,阿爾法狗的創(chuàng)始人哈比斯(如上圖)從小就是圍棋迷,圍棋迷是很難說跳出圍棋看圍棋的,所以他設(shè)計的系統(tǒng)首先是對歷史棋譜進(jìn)行有監(jiān)督訓(xùn)練學(xué)習(xí),通過吸收人類棋譜數(shù)據(jù)中的經(jīng)驗學(xué)習(xí)下棋,觀看數(shù)千場比賽,并被告知人類專家在某些位置上的特定動作,這也是一般人成為武林高手的必經(jīng)之路。而David Silver提出的改進(jìn)版AlphaGo Zero使用了一種新的強(qiáng)化學(xué)習(xí)形式,跳出圍棋歷史經(jīng)驗來下棋,在這一過程中,全靠自學(xué)。采用一個對圍棋一無所知的神經(jīng)網(wǎng)絡(luò),它會與自己進(jìn)行數(shù)千場對弈。它所走的每一步棋就是把這個神經(jīng)網(wǎng)絡(luò)與強(qiáng)大的搜索算法結(jié)合起來,然后用它來選擇下一個動作。在每場對弈結(jié)束后,AlphaGo Zero實際上都訓(xùn)練了一個新的神經(jīng)網(wǎng)絡(luò),這種無師自通的學(xué)習(xí)方式能加速學(xué)習(xí)能力的迭代,所以才有如此成績。
??
??針對第二個問題,顯然AlphaGo Zero這種不參考專業(yè)數(shù)據(jù)和歷史經(jīng)驗的學(xué)習(xí)方式,消除了人類學(xué)習(xí)依靠歷史經(jīng)驗和知識的局限性,未來即使是弱AI,形勢一定比人強(qiáng),理論上講,任何可以明確定義規(guī)則和設(shè)定目標(biāo)的問題或工作都能被AI取代,唯一的瓶頸就是這個規(guī)則,如何有效地定義規(guī)則和目標(biāo)?圍棋的走法貌似隨意但卻有通用規(guī)則,棋盤格局對于殘差卷積模塊來講也很友好,其實這個改進(jìn)思想跟采用GAN自我對戰(zhàn)打游戲是類似的(OpenAI已經(jīng)開發(fā)出了一款A(yù)I,可以在沒有任何人工輸入的情況下,自學(xué)如何玩電腦游戲)。我們看不管是下棋還是玩游戲,都有容易形式化的規(guī)則,而人類的大部分工作,特別是在數(shù)字化、信息化的大背景下,未來被AI替代很可能是分分鐘的事情,如翻譯、交易、駕駛、會計、審計等等。但對需要多方博弈決策方面的事務(wù)來講,這種級別的AI還是無能為力的,當(dāng)然也還談不上類腦智能。
??
??終極算法:統(tǒng)一場論的AI版
??
??要實現(xiàn)真正的AI,是否需要一種終極算法?在筆者看來,愛因斯坦的統(tǒng)一場論是為了解碼宇宙客觀事物運(yùn)行的本質(zhì)規(guī)律;而終極算法就是為了解碼人類智能的本體、本源和統(tǒng)一機(jī)理??恳幌盗忻嫦蛱囟ㄈ蝿?wù)的算法和龐大子系統(tǒng)進(jìn)行組合形成的智能體,當(dāng)然可以在一定程度上具有智能,但要達(dá)到通用AI、超AI的水平,個人認(rèn)為這條路不可行。首先我們看下傳統(tǒng)算法、機(jī)器學(xué)習(xí)算法和終極算法三者的區(qū)別:
??
??(1)傳統(tǒng)算法:將數(shù)據(jù)輸入到計算機(jī),計算機(jī)利用設(shè)計好的算法來進(jìn)行計算處理,最終輸出需要的結(jié)果,比如金融自動交易,需要設(shè)計算法實現(xiàn)交易公式、規(guī)則的計算,輸入數(shù)據(jù)按照設(shè)計好的規(guī)則進(jìn)行計算處理和結(jié)果輸出;
??
??(2)機(jī)器學(xué)習(xí):機(jī)器學(xué)習(xí)算法不需要通過編程設(shè)定計算規(guī)則,而是把數(shù)據(jù)直接輸入到模型中(包括輸入數(shù)據(jù)和標(biāo)簽輸出數(shù)據(jù)),模型經(jīng)過訓(xùn)練獲得預(yù)測優(yōu)化的參數(shù),最終構(gòu)建好具有一定預(yù)測能力和穩(wěn)定性的機(jī)器學(xué)習(xí)模型;
??
??(3)終極算法:終極算法的一個前提假設(shè)是,所有知識,無論是過去、現(xiàn)在還是未來的,都有可能通過單個通用學(xué)習(xí)算法來從數(shù)據(jù)或環(huán)境中獲得,這種算法稱為終極算法。機(jī)器學(xué)習(xí)算法的首要任務(wù)是區(qū)別可以預(yù)測的事與不可預(yù)測的事。終極算法的目標(biāo)則是學(xué)習(xí)一切能夠認(rèn)知的東西,在機(jī)器學(xué)習(xí)中,復(fù)雜性存在于數(shù)據(jù)中,而終極算法要做的就是通過擬合數(shù)據(jù)或拋開數(shù)據(jù)和環(huán)境交互來消化理解這種復(fù)雜性。
??
??幾十年來,機(jī)器學(xué)習(xí)算法研究的五大門派(如上圖)一直以來都在彼此爭奪主導(dǎo)權(quán)。
??
??(1)符號派:使用符號、規(guī)則和邏輯來表征知識和進(jìn)行邏輯推理,最喜歡的算法是:規(guī)則和決策樹。
??
??(2)貝葉斯派:獲取發(fā)生的可能性來進(jìn)行概率推理,最喜歡的算法是:樸素貝葉斯或馬爾可夫。
??
??(3)進(jìn)化派:生成變化,然后為特定目標(biāo)獲取其中最優(yōu)的,最喜歡的算法是:遺傳算法。
??
??(4)類推派:根據(jù)約束條件來優(yōu)化函數(shù)(盡可能走到更高,但同時不要離開道路),最喜歡的算法是:支持向量機(jī)。
??
??(5)聯(lián)結(jié)派:使用概率矩陣和加權(quán)神經(jīng)元來動態(tài)地識別和歸納模式,最喜歡的算法是:神經(jīng)網(wǎng)絡(luò)。
??
??上述傳統(tǒng)算法和各大門派的機(jī)器學(xué)習(xí)算法需要人類知識、規(guī)則、經(jīng)驗和數(shù)據(jù)的支持,是一種歸納和演繹學(xué)習(xí)的范疇,這種學(xué)習(xí)受限于數(shù)據(jù)本身,即使是大數(shù)據(jù)也不能全樣本覆蓋,而且包含各種噪音、錯誤或有偏見的數(shù)據(jù),這樣使得學(xué)習(xí)出來的模型也很難是最優(yōu)的。而終極算法要能進(jìn)行自我創(chuàng)造和學(xué)習(xí),根據(jù)學(xué)習(xí)目標(biāo)去自我創(chuàng)造樣本、自我學(xué)習(xí)來加深對事物的理解從而獲得學(xué)習(xí)能力,這才是真正的智能。能否實現(xiàn)終極算法,怎么實現(xiàn)終極算法,下面從阿爾狗元的強(qiáng)化學(xué)習(xí)、人類大腦新皮層的學(xué)習(xí)機(jī)理和深度學(xué)習(xí)網(wǎng)絡(luò)三個方面的融合來進(jìn)行探討分析。
??
??終極算法的可能性?類腦學(xué)習(xí)的啟示
??
??人腦由一千多億個神經(jīng)細(xì)胞(神經(jīng)元)交織在一起的網(wǎng)狀結(jié)構(gòu)組成,其中大腦皮層約140億個神經(jīng)元,小腦皮層約1000億個神經(jīng)元。神經(jīng)元約有1000種類型,每個神經(jīng)元大約與100個其他神經(jīng)元相連接,形成極為錯綜復(fù)雜而又靈活多變的神經(jīng)網(wǎng)絡(luò)。人的智能行為就是由如此高度復(fù)雜的組織產(chǎn)生的。浩瀚的宇宙中,也許只有包含數(shù)千憶顆星球的銀河系的復(fù)雜性能夠與大腦相比。很多學(xué)科的研究人員試著從不同角度解碼人腦的智能,人工智能從一開始就試圖模擬、延伸和擴(kuò)展人類智能,但迄今為止大部分AI研究成果還僅僅只能從行為上模擬部分智能。如何從更深入的機(jī)制上探索智能的本質(zhì)及其計算實現(xiàn)的機(jī)理,是神經(jīng)計算與類腦學(xué)習(xí)面臨的主要挑戰(zhàn)。對未來終極算法的設(shè)計實現(xiàn),筆者認(rèn)為有三種重要的類腦學(xué)習(xí)方法,也許能給我們一些啟示。
??
??(1)大腦新皮層
??
??Jeff Hawkins在其2004年出版的著作《On Intelligence》中,提出了一種大腦皮層運(yùn)作的記憶-預(yù)測框架。闡述了大腦皮層框架運(yùn)作的核心原理,提出了一種新皮層的理論,用以建立一種基于空間-時間記憶流模式的智能預(yù)測架構(gòu),而且設(shè)計實現(xiàn)了分層皮質(zhì)學(xué)習(xí)算法(HTM)。Jeff Hawkins的大腦皮層理論框架與算法,目標(biāo)很宏大,直指人類學(xué)習(xí)的終極算法。其中有幾個主要理論值得與大家分享:
??
??a.“大腦新皮層是一個分層的架構(gòu)。在分層中的每一層或者區(qū)域,又是由密集包裹著的細(xì)胞組成的多個層。當(dāng)感知信息到達(dá)大腦新皮層時,它穿過了分層架構(gòu)中的各個層。在這些區(qū)域的細(xì)胞變得活躍,逐步對輸入進(jìn)行抽象,得到不變的特征。然而,在架構(gòu)的最底層的細(xì)胞對輸入的簡單的特征做出了最優(yōu)的反應(yīng),離架構(gòu)頂層最近的細(xì)胞則對高層次的概念做出反映,比如對外表、語言、動作等?!薄@跟當(dāng)前深度網(wǎng)絡(luò)的逐層學(xué)習(xí)思想是一致的。
??
??b.“令人吃驚的是,在大腦新皮層中的區(qū)域,無論它們駐扎在什么地方,無論它們處理什么類型的感知信息,它們幾乎都相同的結(jié)構(gòu)。視覺區(qū)域類似于聽覺區(qū)域,也類似于語言區(qū)域。大腦新皮層完全使用了通用的機(jī)制。通過了解這些機(jī)制,我們能夠模擬它們,并將它們應(yīng)用運(yùn)用到學(xué)習(xí)、推理、預(yù)測等多種問題中。盡管基于HTM理論還無法捕捉到大腦新皮層完整的復(fù)雜結(jié)構(gòu)及學(xué)習(xí)機(jī)制,但是它已經(jīng)足夠強(qiáng)大到來解決一些困難且有商業(yè)價值的問題了?!薄@點(diǎn)也許能解釋為什么深度學(xué)習(xí)能如此有效?
??
??c.“HTM是一個記憶系統(tǒng),隨著時間變化,它通過給它的感知數(shù)據(jù)來學(xué)習(xí)它的世界,并從數(shù)據(jù)中抽象出高層的概念。抽象允許HTM網(wǎng)絡(luò)來進(jìn)行一般化(generalize),并對于傳統(tǒng)計算機(jī)編程處理的嚴(yán)格規(guī)則提供靈活性和效率。例如,在不完整或是模糊不清的數(shù)據(jù)呈現(xiàn)中,模式能夠被學(xué)習(xí)并識別出來。通過組合模式學(xué)列的記憶與當(dāng)前的輸入,HTM網(wǎng)絡(luò)能夠預(yù)測下一步可能發(fā)生什么。反過來,這種預(yù)測能夠使用在從猜測可能的結(jié)果到檢測欺詐等一系列的認(rèn)知活動中?!薄@點(diǎn)出了深度學(xué)習(xí)未來的潛力,特別是跟記憶的融合。
??
??可以看出Jeff Hawkins在13年前就提出的大腦新皮層理論框架,與當(dāng)今大火的深度學(xué)習(xí)有著異曲同工之妙。不過在具體算法實現(xiàn)上與深度網(wǎng)絡(luò)有較大差異,不過整套理論的核心思想就是要實現(xiàn)解碼智能的終極算法,潛力如何還有待觀察。
??
??(2)深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)
??
??深度學(xué)習(xí)專家們講得比較多,我就不贅述了。值得一提的是,深度學(xué)習(xí)的類腦模擬研究還很初級,神經(jīng)計算和深度學(xué)習(xí)的交叉融合其實還遠(yuǎn)沒有開始。深度學(xué)習(xí)的加層機(jī)制來源于對人類大腦視覺分層處理的理解,而原人工神經(jīng)網(wǎng)絡(luò)也只是很初級的模擬了人腦神經(jīng)元的連接和激活。人腦實現(xiàn)學(xué)習(xí)、記憶、推理、情感等能力的生化神經(jīng)網(wǎng)絡(luò)運(yùn)行原理我們根本都還知之甚少,但是,深度學(xué)習(xí)加減層、加減神經(jīng)元、加減鏈接、跨層跨連接等這些簡單的網(wǎng)絡(luò)構(gòu)建方法卻是跟人腦的運(yùn)行機(jī)制有類似的地方,幼兒到成人神經(jīng)元數(shù)量在增加、學(xué)習(xí)和記憶能力提升是神經(jīng)元之間鏈接的建立和加強(qiáng),而能力衰退也對應(yīng)于神經(jīng)元鏈接的斷裂等等…
??
??可以說,深度學(xué)習(xí)在借鑒大腦神經(jīng)網(wǎng)絡(luò)原理和人類認(rèn)知過程方面,也許還沒入門,還有很多問題需要深入挖掘和拓展。比如讓Deepmind情有獨(dú)鐘的強(qiáng)化學(xué)習(xí),與深度學(xué)習(xí)強(qiáng)強(qiáng)聯(lián)合之后,在很多智能研究中大放異彩。強(qiáng)化學(xué)習(xí)的主要目的是幫助模型形成從環(huán)境到行為映射的學(xué)習(xí),這種學(xué)習(xí)方法不是告訴系統(tǒng)如何產(chǎn)生正確的動作,而是通過評價產(chǎn)生動作的好壞來不斷迭代改進(jìn)學(xué)習(xí)能力,從而找到問題的最優(yōu)解。而且強(qiáng)化學(xué)習(xí)在一定程度上能解決深度學(xué)習(xí)嚴(yán)重依賴大數(shù)據(jù)的問題。
??
??總之,未來終極算法的誕生,可能是多種學(xué)習(xí)方式的深度交叉融合,機(jī)器的情感、記憶推理等高級智能,將會由基于深度特征學(xué)習(xí)和加裝存儲記憶、推理模塊的遷移學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、對抗學(xué)習(xí)等各種學(xué)習(xí)方式的交叉融合而實現(xiàn),未來的機(jī)器學(xué)習(xí)方式可能遠(yuǎn)不只這幾種,其本質(zhì)都是在模仿人類的學(xué)習(xí)方式。遷移學(xué)習(xí)代表了我們的進(jìn)化過程,學(xué)習(xí)的舉一反三、觸類旁通,強(qiáng)化學(xué)習(xí)、對抗學(xué)習(xí)類似周伯通左右互搏、無師自通等,以深度學(xué)習(xí)思想為主線的算法和框架技術(shù)棧將極大地拓展五大機(jī)器學(xué)習(xí)門派的功力。
??
??展望
??
??嚴(yán)格來講,傳統(tǒng)規(guī)則式AI系統(tǒng)還稱不上智能,而現(xiàn)在的深度學(xué)習(xí)也只是大數(shù)據(jù)驅(qū)動的初級智能。以前我提過一個問題,未來有沒有非數(shù)據(jù)驅(qū)動的終極智能?換句話說,如果沒有大數(shù)據(jù),除了專家系統(tǒng)和規(guī)則式AI,人工智能要通用化,要達(dá)到SuperAI的水平,能否有所突破?這取決于終極算法的能力。
??
??規(guī)則式AI更多靠人工內(nèi)置的經(jīng)驗和知識驅(qū)動,它最大的問題也是要人工介入,而且很難具有學(xué)習(xí)能力,靠的知識、記憶和經(jīng)驗建立的規(guī)則體系,這種不能自學(xué)習(xí)的符號AI系統(tǒng)隨著明斯基的去世,在逐步退出歷史舞臺。而強(qiáng)AI的目標(biāo)是機(jī)器智能化、擬人化,機(jī)器要具有和人一樣的能力,那就離不開記憶和經(jīng)驗,也離不開通過知識、經(jīng)驗和記憶建立起來的認(rèn)知體系(經(jīng)驗規(guī)則、知識本體)。
??
??從這個角度講,強(qiáng)AI要實現(xiàn)只靠深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)還不夠,通過深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)進(jìn)行環(huán)境基礎(chǔ)知識的初步監(jiān)督式指導(dǎo)學(xué)習(xí)或非監(jiān)督自我體驗學(xué)習(xí),學(xué)習(xí)掌握的知識、經(jīng)驗必須要能存儲和記憶,再結(jié)合大腦新皮層理論的時間-記憶流預(yù)測框架,在遇到新的問題之后,就能像人一樣快速智能響應(yīng)。這也許就是未來終極算法的融合誕生之路吧?
來源:自動化網(wǎng)      時間:2017-10-30 10:11:43


上一條新聞: 關(guān)于西門子變頻器的故障維修案例-四條橫杠
下一條新聞: 國務(wù)院常務(wù)會議通過《深化“互聯(lián)網(wǎng)+先進(jìn)制造業(yè)”發(fā)展工業(yè)互聯(lián)網(wǎng)的指導(dǎo)意見》
版權(quán)所有:蘇州羅米達(dá)自動化設(shè)備有限公司    地址:蘇州工業(yè)園區(qū)唯亭浦田路75號朱家工業(yè)園E3幢    郵編:215000
推薦產(chǎn)品:KN95口罩機(jī),視覺檢查量測系統(tǒng),干式復(fù)合機(jī)自動視覺辨識及包裝系統(tǒng),自動物料輸送系統(tǒng),非標(biāo)準(zhǔn)客制化生產(chǎn)系統(tǒng),全自動轉(zhuǎn)向機(jī)
電話:0512-6289-2918     傳真:0512-6289-2908-850    聯(lián)系人:周經(jīng)理    手機(jī):18913759602    公司QQ:2356276066   郵箱:alex.zhou@lmd-auto.com

| 備案號:蘇ICP備14013079號-1