分身伐樹

我們做了很多的資料應用,包含公司資料登記以及果菜花終端機。使用資料痛苦的地方在於準備資料,資料科學家平均會花上 50% 到 80% 的時間在搜尋、清理資料。我們知道,在國際性企業內,有一些人每天的全職工作就是去手動下載新的經濟指標,更新報表。人類應該可以做更有意義的工作。

我們想要問的問題是:有沒有可能把所有的資料全部都抓下來,清理好,並有統一的 API 接口可以存取?你所看到的 SheetHub 就想要做這一件事情。資料丟過來之後,就會自動整理,輸出成 excel 或著是 JSON。假如是地理資訊檔,自動幫忙畫好地圖,以及其他很酷的功能。

接下來我們希望把台灣的開放資料倒進來,清理好並保持更新。這方法聽起來有一點暴力,但總要有人做。不過由於在開發的過程中,Sheethub 會處於功能不穩定以及界面隨時會被調整的情況,為避免造成操作的混淆,目前 SheetHub 暫停測試帳號的開放,等待功能較穩定之後會再開放測試帳號,並且對原先已申請使用者優先寄出測試邀請。而您仍可以以瀏覽者的身份在 SheetHub 搜尋或是下載各種資料集。若對於現有在 SheetHub 上面的資料集有問題或是有任何疑問建議也歡迎透過 ask@sheethub.com 跟我們聯繫。

王向榮,李慕約