最近有一家中國公司以黑馬之姿在自動駕駛領域異軍突起。圖森科技宣布,該公司在自動駕駛算法公開排行榜KITTI和Cityscapes評測數據集上獲得了九個世界第一。 這是KITTI和Cityscapes評測數據集上第一次有一家公司“霸榜“。而圖森科技的競爭者,都是百度、三星、英偉達、斯坦福、中科院、多倫多大學、NEC實驗室、加州大學圣迭戈分校等這些名企名校及科研機構。和這些巨頭們相比,圖森只是一個剛成立一年的創(chuàng)業(yè)公司。 即便獲得了如此驚人的成績,圖森科技CEO陳默依舊很不滿足。他對新浪科技說,“霸榜“其實是為了向投資人證明圖森科技在自動駕駛領域是領頭羊,這僅是手段。圖森真正想做、并且在做的事情其實是貨運商用車的自動駕駛。 根據中物聯(lián)統(tǒng)計數據顯示,2015年道路運輸費用3.3萬億元,可交易的公路貨運市場總體規(guī)模在2.6萬億左右。 陳默認為這是一個無比巨大的市場,至于巨頭云集,而且高難度和高復雜度的大眾消費級自動駕駛,他坦言并不興趣,落地需要的時間太長,而時間對于一家創(chuàng)業(yè)公司而言太寶貴了。 “自動駕駛加貨運足夠支撐起圖森科技的夢想,我們想改變行業(yè),我們也想帶著圖森上市。更現實的角度來說,年輕的圖森科技還可以在這個領域進行彎道超車。“陳默說,2017年是他們對貨運自動駕駛落地的預期,現在就是和時間賽跑。 人工智能中國并不遜于國外 現在的投資圈,人工智能已經成為最熱的議題,但是和以往互聯(lián)網的投資相比,中國的投資人們似乎更愿意去看國外的創(chuàng)業(yè)公司,認為他們在這個領域更加先進。 對于這種取向,陳默有些忿忿不平,他覺得其他方面可能確實存在這種差異,但是基于大數據和深度學習的人工智能,中國和國外幾乎是同時起步,差距其實很小,甚至在不少領域都是領先的。 “去參加 KITTI和Cityscapes評測數據集,目的其實很簡單。我們說自己是領先的,怎么證明?沒有什么比這種世界級的公開排行榜更具有說服力了,因為參與者都是最牛的機構和人。“ KITTI由德國卡爾斯魯厄理工學院和豐田美國技術研究院聯(lián)合創(chuàng)辦,是目前國際上最大的自動駕駛場景下的計算機視覺算法評測數據集。 用了一個月時間,圖森科技在KITTI數據集上,拿到了目標檢測中車輛檢測、行人檢測、自行車三個單項、目標追蹤中車輛追蹤、行人追蹤的兩個單項、道路分割包括urban unmarked、urban marked、urban multiple marked三個場景及前三個場景的平均值urban road等四個單項四個單項的總計九項第一。 而Cityscapes數據集則是由奔馳主推,提供無人駕駛環(huán)境下的圖像分割數據集。用于評估視覺算法在城區(qū)場景語義理解方面的性能。在fine和coarse兩套評測標準中,圖森排名靠前,人臉關鍵點定位的兩個評測數據集300W和AFLW上排名第一。 十年積累 去參加KITTI和Cityscapes評測數據集“刷榜“其實是一件很冒險的事情,因為參加這種級別的競爭,無論是大公司還是小公司,都需要相關的研究團隊和個人全身心地投入,工作停擺。如果沒有拿到成績,對于創(chuàng)業(yè)公司而言,無疑是沉重打擊。 尤其是圖森科技還有著巨大的野心,不滿足于一兩項的第一。 陳默告訴新浪科技,這種規(guī)模化的“霸榜“是他們一開始就想好的,要的就是不鳴則已,一鳴驚人的效果。所以他們選擇了最開始就攻克難的項目,有把握的項目放在后面,甚至有項目僅用了一天時間,在最后截止日期上交的。 之所以敢這么做,陳默說是因為他有特別牛的團隊。 圖森科技有兩個團隊,工程及商業(yè)化團隊在中國北京,核心算法研究院在美國加州圣地亞哥。目前公司規(guī)模70人左右,北美研究院有20個人在做核心算法,國內算法部門10人,硬件部門10人,工程部門10人。 北美研究院由聯(lián)合創(chuàng)始人兼CTO的侯曉迪領導,他是加州理工學院的博士,計算機視覺和認知科學領域專家,創(chuàng)立了基于頻域的視覺注意機制理論,基于這個理論的論文已經被引用2000多次。 國內算法團隊由首席科學家王乃巖帶領,他是香港科技大學博士,2014 Google PhD Fellow計劃的入選者,多次在國際數據挖掘和計算機視覺比賽中名列前茅。 工程技術VP郝佳男,南洋理工大學博士,有十年并行和分布式運算研究經驗,曾是淡馬錫國家實驗室研究員。另一位算法科學家黃澤鏵則是卡內基梅隆大學機器人學碩士,計算機視覺和人臉分析領域專家,負責圖森的駕駛員監(jiān)控系統(tǒng)研發(fā)。 圖森科技成立于2015年9月份,陳默認可“黑馬“的論調,卻不愿意別人給圖森貼上“AI新人“的標簽?!拔覀儓F隊已經在人工智能方面研究了十年,這一年僅僅是厚積薄發(fā)而已“。 自動駕駛加貨運 在自動駕駛之前,圖森科技最開始做的是基于圖片識別的廣告業(yè)務,為用戶瀏覽過的圖片打上關鍵詞標簽,通過算法精準匹配,讓廣告主找到最適合產品定位的投放廣告位等工作。 雖然營收在千萬級,但陳默和他的小伙伴的們并不滿足于此。陳默直言,技術團隊們想做一些更酷的能改變世界事情,而他通過幾次創(chuàng)業(yè),已經實現了財務自由,這次他希望能帶著一個公司走向上市。計算機視覺在廣告領域,天花板太低。 轉型是從今年年初開始的,陳默說轉型的決定很快都在團隊內部和投資人新浪那里通過了,那么轉向哪里? “計算機視覺目前就人臉識別、安防和交通三大應用領域。人臉識別和安防可以歸到一大類中,國內幾家計算機視覺公司已經做了很久了,而且還有??低?、大華等上市公司,不是一個好跑道。自動駕駛,雖然有很多大公司在嘗試,但是整個市場還在探索,而且前景廣闊。“ 雖然說目前自動駕駛還在探索階段,但是自動駕駛是目前最為熱門的科技領域也是無可回避的事實。谷歌、百度、英特爾、Uber、豐田、本田、福特等科技和車企巨頭,Mobileye等大量專業(yè)技術提供方都是圖森要面臨的對手。 而陳默眼中,他們和圖森其實是不同跑道的選手?!八麄兿牍フ嫉氖谴蟊娤M市場,面對的是消費者。而我們想做的是貨運商用市場,面對的是企業(yè)“。 按照他的介紹,在自動駕駛上,圖森互聯(lián)的目標是與運營車輛企業(yè)合作,為定制攝像頭配合毫米波雷達的低成本自動駕駛算法和解決方案。模式其實與國外自動駕駛卡車公司Otto相似,為高速公路、礦區(qū)卡車提供自動駕駛系統(tǒng)。 圖森目前正在和北奔研究院、北京理工大學進行合作,聯(lián)合研發(fā)軍用重型汽車的自動駕駛技術。北奔主要提供整車平臺以及相關試驗資源,北理工為自動駕駛車輛的研發(fā)提供運動控制技術,圖森負責計算機視覺和深度學習算法部分,提供以攝像頭為主、配合毫米波雷達和視覺芯片的、經濟型自動駕駛解決方案。最快需要1年的時間出原型車。 陳默的設想是,圖森技術的自動駕駛汽車在2017年或者2018年就可以上路。 快速商業(yè)化落地 作為一個連續(xù)創(chuàng)業(yè)者,陳默將自己定義為一個務實的領導者,這讓他避開了技術公司常常會遇到的一些理想主義的坑,也讓圖森在商業(yè)化上走得也比較早。無論是貨運還是多目攝像頭加毫米波雷達的綜合解決方案,都是立足于讓技術更好地落地。 “以激光雷達為核心,然后配上高精度地圖的技術路線,不適合創(chuàng)業(yè)公司,成本太高了,一套64線激光雷達要8萬美元,一臺無人駕駛車基本上要裝四部,而且降價恐怕至少要等到2020年。為什么谷歌先行了這么多年,一直沒有大規(guī)模推廣,成本是很大的一個因素“。 對于圖森所選擇的計算機視覺加毫米波雷達的方案,陳默表示,這會讓成本降到激光雷達的二十分之一,而且能夠實現數據采集和高精地圖標定的快速部署,低成本和易量產讓這種方案在商業(yè)化上會走得更快。最大的難點就是對算法的要求極高,但是這是圖森的優(yōu)勢所在。而且有一天計算機視覺識別和深度足夠強大的時候,可能就再也不需要激光雷達了。 選擇貨運方向,也是現實和理想的結合。 “貨運是個萬億級的市場,中國有兩千多萬的運營車輛,從市場容量來看,這是一個天花板極高的市場。而且自動駕駛減少貨運公司雇傭成本,讓他們也愿意和我們合作?!皳惸嘎?,已經有物流公司打算和圖森合作試點。 從技術難度而言,貨運也是一個更快落地的方向。路線單一,基本都是高速路段,路況復雜程度遠遠低于城區(qū),數據好收集等等都是貨運的優(yōu)點。 按照陳默的計劃,最開始的目標是讓每輛車減少一個司機,在指定路段下自動駕駛。到最后一個運輸車隊只需要一到兩個司機,其他車輛追隨領頭車無人駕駛。這個原型化方案最快將在1年半之內達成。接下來,服務還可以蔓延到整個車隊的管理系統(tǒng)。 更近能夠實現的事情是ADAS硬件的落地,圖森將從“兩客一?!?、室內公交等運營車輛入手。通過將4路攝像頭連接車內計算機,在碰撞之前,對周邊行人和車輛進行識別以及運行軌跡的測算,從而為司機提供碰撞預警。該產品將在4個月后投入市場,目標客戶是公交公司以及運營車企等。 陳默說,從起步到上市,肯定是漫長而艱辛的過程。但是這次他憋著一口氣,要和兄弟們一起帶著圖森上市。
«
未來人類生命安危 或離不開人工智能
|
OKCoin幣行比特幣回溫 比特幣支付在日本成潮流
»