隨著ChatGPT的面市,眾多的行業(yè)都聞風(fēng)而動(dòng),很多大佬更是表示,在AI下,很多行業(yè)都可以重做一遍。
而將AI整合進(jìn)手機(jī)中,也是手機(jī)行業(yè)的共識(shí),很多所謂的端側(cè)大模型手機(jī),AI手機(jī)的概念層出不窮。
而蘋(píng)果反而在一塊,沒(méi)有太多的動(dòng)作,很多人認(rèn)為蘋(píng)果在AI時(shí)代是徹底的落后了。
但是從現(xiàn)在的情況來(lái)看,蘋(píng)果在放棄了造車(chē)之后,似乎找到了一條AI手機(jī)的道路,那就是一個(gè)叫做“Ferret UI”的新模型。
在談這個(gè)模型之前,我們先談?wù)劕F(xiàn)在其它廠商的所謂的AI手機(jī),這些手機(jī)的所謂AI,主要從兩個(gè)方面來(lái)實(shí)現(xiàn),一個(gè)是硬塞一個(gè)大模型進(jìn)去,通過(guò)云端或本地算力驅(qū)動(dòng),和Kimi助手,GPT app沒(méi)有什么本質(zhì)區(qū)別。
第二個(gè)則是將AI能力賦能在其預(yù)裝應(yīng)用之中,最多形成魔法修圖,短信回復(fù)自動(dòng)生成這些功能,但其實(shí)這功能沒(méi)有AI也一樣能行。
所以毫不客氣的說(shuō),目前的AI手機(jī),其實(shí)更多是噱頭,沒(méi)什么實(shí)際意義,大家也沒(méi)有找到真正的AI之路,AI大模型能力都還僅僅停留在手機(jī)系統(tǒng)之外。
但蘋(píng)果的“Ferret UI”大模型不一樣,一方面它能夠?qū)D像、UI等進(jìn)行定位識(shí)別,用戶(hù)可以基于手機(jī)屏幕中具體的區(qū)域與大模型展開(kāi)更深入的對(duì)話。
二是“Ferret UI”能夠識(shí)別語(yǔ)音、文字等,包括詳細(xì)描述、感知/交互對(duì)話和功能推理等。
這樣這個(gè)“Ferret UI”就能夠嵌入iOS系統(tǒng)之中,不僅僅只是文字識(shí)別,還能夠基于當(dāng)前手機(jī)屏幕展的頁(yè)面,各種圖像進(jìn)行識(shí)別,然后和用戶(hù)進(jìn)行互動(dòng)。
如果嵌入siri之中,用戶(hù)可以用語(yǔ)音操作手機(jī)中的絕大部分功能,甚至到APP中的功能,因?yàn)樗茏R(shí)別屏幕中的所有圖像,對(duì)于手機(jī)應(yīng)用的功能,操作等,能夠形成相對(duì)完整的理解。
這樣用戶(hù)有什么需求,就真的不需要自己動(dòng)手了,動(dòng)動(dòng)嘴即可,這和當(dāng)前那些所謂的AI手機(jī)是有本質(zhì)區(qū)別的。