Category Archive for 'AI'

Posted By Mr. Thursday
前兩篇分別定義了機器學習的問題,以及數學基礎知識的補充。這一篇終於要正式介紹,SVM問題定義最佳化問題的這一步驟。
首先讓我們回想一下前兩篇使用的例子,把照片分成兩類的這個學習問題。下面這張圖是最後機器看待這個問題的方式:

紅色和藍色的座標軸,分別代表紅色和藍色的強度座標軸。因為現在每張照片只有紅色和藍色強度兩個特徵,所以每張照片依照這兩個特徵,可以在平面上這個「二度空間」,座落在某個座標點上面。除了座落在平面上某個點以外,在機器學習的訓練階段,每個學習範例,除了本身特徵讓自己座落在空間裡面某個地方以外,還有正確答案的標記,像是在照片分類問題裡面,要分成有橘子和沒有橘子兩類,在上圖中,圈圈代表那一張照片裡面有橘子,叉叉代表那一張範例照片裡面,沒有橘子。
當每張照片都在特徵 (feature)空間裡面找到一個地方以後,範例照片也依照正確答案標記圈圈叉叉以後,在機器訓練階段,未知的東西,就是要求出一條直線,或是在高維度空間裡面,一個超平面(hyper-plane),這條直線會當成機器在訓練階段求出來的模型 (model),之後在機器預測階段,會拿來預測特徵空間裡面新加進來的照片,可是這個時候沒有圈圈叉叉,必須要依靠學習出來的直線,在直線右上方預測為有橘子 (也就是預測是圈圈照片的一份子),在直線左下方,就預測為沒有橘子 (也就是預測為是叉叉照片的一份子)。
那麼現在在訓練階段,機器有每張範例照片的座標點,也有目標要學習出一條直線當作日後預測的模型 (model),那這個目標和範例們,要怎樣子化成最佳化問題(optimization problem),也就是把目標化成數學的「目標式」(goal),範例帶來的條件限制,化成數學的「限制式」(constraint),請看以下說明。

Read Full Post »

Posted By Mr. Thursday
在SVM之旅(1) - 問題定義篇裡面,把機器學習怎樣子提出問題和解決問題的想法,稍微介紹了一下,簡單地說就是有已知,有未知,在訓練階段想要經由範例所提供的已知和未知的正確對應,學習出一個模型。在我們舉的例子裡面,學到的模型是用平面上的一條直線來表示,而這條直線在應用和預測的階段,就會拿來預測沒有正確答案的未知的東西。
這篇文章則是再進入第二個景點,也就是SVM問題定義之前,想要多作一些補充說明,因為SVM問題正式的定義,無可避免地一定會使用到數學符號,然而有些讀者可能對SVM有興趣,可是大部分數學背景已經忘的差不多了,因此這篇文章希望像是鐵路局週末加開的列車一般,讓數學快忘記的讀者,可以裝滿彈藥,後面的文章也就能夠勝任有餘,對數學沒有恐懼感,反而覺得親切囉!
本篇文章大致會介紹下面幾點:(1) 將上次問題定義的符號稍作調整,方便下篇討論的符號使用。(2) 平面上的直線怎樣子把平面上的點分成左右兩邊。(3) 「空間」的概念,以及如何從平面的二度空間,進一步理解三度空間,甚至更高維度的空間概念。

Read Full Post »

SVM之旅(1) - 問題定義篇

Posted by Mr. Thursday
各位2010年新年快樂!今天要和大家一起拜訪SVM第一個景點 — 問題定義篇。在之前有先把整個SVM之旅的各景點做個大綱介紹,今天是第一個景點,我們要先把SVM想解的問題定義清楚再繼續往下走。
(1) - (1) 從「已知」到「未知」
所謂SVM是Support Vector Machine的縮寫,中文可以翻成「向量支援機」,是一種機器學習的演算法。我們先談談機器學習的動機好了。機器學習 (Machine Learning) 顧名思義,就是想讓機器如同人類一樣具有智慧,有學習能力,可以幫助人類自動化完成一些原來人力才能完成的事情。
然而機器和人類,為什麼要先學習呢?因為機器和我們一樣有各種接觸外界的輸入裝置,像人類有眼睛可以看,有耳朵可以聽,看的到的聽的到的,就是我們的「已知」。然而我們想要解決的事情,常常是看不見聽不到,「未知」的事情。譬如說一堆還沒照年代排序好的書本,我們看的到每一本書的出版日期,是「已知」,然而把書本排好,在解決問題之前,就是「未知」的部分了。又如同今天股市收盤價,是我們的「已知」,但是明天股價會漲還是跌?未來的事情,尚未解決,就是「未知」了。
接著又因為我們有學習的能力,因此無論是尚未完成的事情,還是未來的事情,還是物品分類的事情,只要我們有智慧學習,都可以從「已知」來求得「未知」的事物。人類上課學習,機器如何學會的這們學問,就稱為「機器學習」吧!
(1) - (2) 機器學習兩階段–訓練和預測

Read Full Post »

SVM之旅 - 行前準備篇

Posted By Mr. Thursday
在〈機器學習與腦機介面的願景〉裡面曾經稍微提到一下SVM,最近筆者正在重新複習SVM當中,因此打算寫幾篇相關文章,就SVM這個主題,做一些簡介。本篇文章會先整理一下Google到的相關資源,以及針對SVM數學部分,做一個大鋼的整理,猶如旅行之前,先安排一下行程,真正旅行的時候在一個個景點拜訪,出發之則是有個行程表,讓旅行途中有個目標,不至於迷路了!
接下來讓我們先看看網路上有哪些SVM簡介相關的資源吧!
SVM相關網路資源

Read Full Post »

Posted By Mr. Thursday
Web2.0簡單地說,就是集中人的智慧,在網路上分享內容,以求三個臭皮匠勝過一個諸葛亮的效果。雖然這種群體智慧 (collective intelligence) 有時候被稱為是工人智慧,不過我想就如同一個國家從未開發到已開發一樣,只要方向走對,工人智慧總有一天會變成人人智慧,您說是吧?
原文於2008/11/28 發表於MMDays。
Google 最近推出新的搜尋介面,稱為 SearchWiki,使用者可以對自己搜尋的結果作修改,譬如說修改搜尋結果網頁的先後次序,或是直接移除某一項搜尋結果 (刪錯可以救回來) ,以及為某一項搜尋結果加上一些文字註解。下面這段影片可以讓各位比較清楚地看到整個介面和操作的流程:

這項功能目前要使用者在登入Google帳號的狀態下才會出現,並且要選英文介面才可以,中文介面暫時還沒有這項功能出現。
這個功能可以讓使用者自己排序搜尋結果,不過只會影響自己的搜尋結果,會和別人分享的只有文字註解。因此,針對個人化排序結果的分享,我想到了有三種方式,或許可以對應到各種不同的資訊來源或是使情境:個人使用、完全公開、以及朋友傳遞鏈。

Read Full Post »

拼圖網站的構想

Posted By Mr. Thursday
Web2.0簡單地說,就是集中人的智慧,在網路上分享內容,以求三個臭皮匠勝過一個諸葛亮的效果。雖然這種群體智慧 (collective intelligence) 有時候被稱為是工人智慧,不過我想就如同一個國家從未開發到已開發一樣,只要方向走對,工人智慧總有一天會變成人人智慧,您說是吧?
原文於2009/2/27 發表於MMDays。

現在網路上有許多相片服務網站,像是Flickr、Picasa、以及各類相簿空間網站。基本功能通常都是上傳相片,分享給朋友,增加註解或標示人名地點等等。今天想要提出來的,則是拼圖功能的構想。為什麼要拼圖呢?我想分為幾個部分來探討,簡單來說,對使用者可以有趣味和社交的功能,對電腦來說可以有類似 reCAPTCHA 的學習看懂圖片的功能,對於平台提供者來說,也許是另外一種服務搭配廣告的模式。
接下來讓我們先回想一下一般拼圖遊戲的規則。通常就是一張圖,然後在電腦上面,可以用電腦自動切割成很多片。每一片拼圖之間,都會有一些凹凸的部分,作為使用者拼圖的線索。因此無論是風景照片、人物照片、商品照片,都可以先用電腦切割,變成拼圖遊戲。不過接下來,也許還可以有一些變化。

Read Full Post »

Web2.0生產力之探討

Posted By Mr. Thursday
Web2.0簡單地說,就是集中人的智慧,在網路上分享內容,以求三個臭皮匠勝過一個諸葛亮的效果。雖然這種群體智慧 (collective intelligence) 有時候被稱為是工人智慧,不過我想就如同一個國家從未開發到已開發一樣,只要方向走對,工人智慧總有一天會變成人人智慧,您說是吧?
原文於2008/11/2 發表於MMDays。
Web2.0主要的想法,就是希望讓使用者同時也是生產者,譬如說 Wikipedia,除了讓使用者閱讀,使用者也可以貢獻內容,如果是文字以外的內容,譬如說影像或音樂,Web2.0也希望成為一個平台,讓使用者容易產生或重製內容的工具。然而除了內容共同製作、重新製作會產生著作權的問題之外,經濟面上的考量,大概是就獲利的部分了。首先必須讓使用者有動機來生產內容,其次,即使使用者願意不收代價貢獻內容,提供平台的第三者又要怎樣子獲利?除了廣告模式,目前似乎還沒有很好的商業模式 (business model) 。本篇文章也先不談到這個部分,不過先談談商業模式的前一步,Web2.0生產力的分析。也許透過對Web2.0生產力特性的分析,我們可以把Web2.0如何生產內容看的更清楚,進而有機會想到除了廣告模式之外,有哪一種新的商業模式可以在Web2.0網站上實行。
那麼,使用者會怎樣子透過Web2.0的方式來分享和貢獻內容呢?在這邊我分成三大部分來探討:(1) 使用者圍繞既有內容外圍產生新的內容。(2) 使用者透過分割重組方式產生新的內容。(3) 產生內容對於獲利可能的關鍵步驟。

Read Full Post »

Posted By Mr. Thursday
Web2.0簡單地說,就是集中人的智慧,在網路上分享內容,以求三個臭皮匠勝過一個諸葛亮的效果。雖然這種群體智慧 (collective intelligence) 有時候被稱為是工人智慧,不過我想就如同一個國家從未開發到已開發一樣,只要方向走對,工人智慧總有一天會變成人人智慧,您說是吧?
原文於2007/8/17 發表於MMDays。
有句話是「一張圖勝過千言萬語」(One picture is worth a thousand words.)。照片的分享可以讓我們接收更直接的視覺資訊。目前網路上有很多網路相簿,我們透過手機或是數位相機得到的照片可以放在網路上,分享給朋友。然而 Web 2.0 是否能夠帶來更新的分享方式呢?本篇文章想從地區化應用 (location-based) 開始談起,由三個座標軸來探討:時間 (過去、現在、未來)、地點 (使用者所在位置、使用者不在的位置)、以及分享方式 (同步、非同步),並且提出照片分享在交友上的應用,以及交友和直銷,與 Web 2.0 的 business model 的關係,期待和大家的腦力激盪 (brainstorming),可以創造出更多想法。

Read Full Post »

Posted By Mr. Thursday
Web2.0簡單地說,就是集中人的智慧,在網路上分享內容,以求三個臭皮匠勝過一個諸葛亮的效果。雖然這種群體智慧 (collective intelligence) 有時候被稱為是工人智慧,不過我想就如同一個國家從未開發到已開發一樣,只要方向走對,工人智慧總有一天會變成人人智慧,您說是吧?
原文於2007/8/11 發表於MMDays。
機器翻譯是一項不容易的事情。在等待機器翻譯的技術之前,也許我們可以先考慮以 Web 2.0 的方式來翻譯。想法很簡單,先從 Wikipedia 和 Wiktionary 來看,我們如果打算開始,就是開發一個類似的平台,然後由使用者來貢獻內容,只不過貢獻的內容是「翻譯」的內容。然而光是這樣子,可能還不大夠,首先就是有「誘因」(incentive) 的問題,使用者願意分享翻譯內容的誘因需要思考。其次是商業模式 (business model) 的問題,開發這個平台的人是否能夠獲取報酬。我想 Web 2.0 的服務,最頭痛的應該就是這兩個問題,甚至內容分享上還會有著作權的問題。不過我們既然有了大腦皮質,有問題也不用怕,只要肯花腦筋,我想沒有甚麼問題是無法解決的。下面我就先設想一下機器翻譯可能遇到的問題,然後提出結合以 P2P為架構 的通訊軟體 Skype 的 Web 2.0 翻譯服務,並探討其可能的優點和缺點,如果有興趣的人也不妨繼續烹調這個點子吧!

Read Full Post »

Web 2.0 與教育

Posted By Mr. Thursday
Web2.0簡單地說,就是集中人的智慧,在網路上分享內容,以求三個臭皮匠勝過一個諸葛亮的效果。雖然這種群體智慧 (collective intelligence) 有時候被稱為是工人智慧,不過我想就如同一個國家從未開發到已開發一樣,只要方向走對,工人智慧總有一天會變成人人智慧,您說是吧?
原文於2007/8/3 發表於MMDays。
在 80286 電腦的時代,有一種軟體叫做 CAI (Computer Aided Instruction),讓我們可以透過電腦的輔助來學習,譬如說用小遊戲,或是機智問答,在一問一答之間,可以學會不少東西。網路和多媒體裝置出現後,開始有了 e-learning,使用者用一片互動式光碟,或是透過上網的方式,可以在更好的畫面裡面透過遊戲來學習,或是即時評量學習情形來調整進度,或是重複收看上課的錄影。今日網際網路的發展,讓頻寬增加,內容爆增,使用者參與的 Web 2.0 也將要開始。MIT OpenCourseWare 已經陸續將一些課程的錄影和教材放在網路上,Apple 的 iTunes U 也提供了各大學的課程錄影或錄音,可以經由 iTunes 來下載收聽。從過去的資訊缺乏,到今日的資訊過量 (information overload),我想 Web 2.0 使用者參與,第一步可以先過濾 (filter) 既有內容,或是經由相同喜好的使用者的群聚 (cluster),把內容依照喜好分類 (preference),讓相同喜好的使用者透過評分或是推薦的分享,過濾出他們都喜歡的內容,成為個人化 (personalized) 的內容。最後再經由積沙成塔 (long-tail) 的方式,讓使用者的回饋 (feedback) 變成新的內容。

Read Full Post »

 Page 1 of 2  1  2 »