TensorFlow產品經理Clemens Mewald提到,學術界和業界都非常關注機器學習的演算法和效能,但是資料是其中最根本的要素,一旦資料錯誤,計算相關的最佳化工作都將前功盡棄,因此資料整理是一件重要的工作,以資料理解以及驗證來確保資料的正確性以及可用性。少量的資料可用人工的方式進行整理,但是在實務上,以人工進行資料驗證,就有點不切實際,因為資料通常以連續且大量形式抵達,所以有必要使用自動化和可擴展的資料分析、驗證以及監控方法。
而TensorFlow釋出的資料驗證TFDV是TFX(TensorFlow Extended)平臺的一部分,是Google每天用來分析和驗證PB級資料的技術,在快取中就能有效發現錯誤資料,將能幫助TFX使用者維護機器學習工作管線的健康運作。TFDV可以用在筆記型電腦以及產品環境的資料驗證,Clemens Mewald表示,在設計TFDV初期,他們就決定讓TFDV也能在筆記型電腦環境中運作,因為讓資料科學家和工程師,越早可以在工作流程使用TFDV越好,即便他們僅使用一小部分的資料進行研究,仍然要確保他們可以檢查並驗證使用的資料,除了避免錯誤發生外,也讓後續遷移至大規模部署的工作變得簡單。
TFDV基礎建立在一個強大的函式庫之上,能用來計算機器學習資料的描述性統計資料,這些統計資料將有助於開發人員了解他們的資料。而TFDV API目的在讓連接器可以使用不同的資料格式,並提供足夠的靈活性與擴展性。TFDV使用Apache Beam來定義和處理其資料工作管線,所以現有的Beam IO連接器以及使用者定義的PTransforms,可被用來處理不同的格式和資料表示法。
TFDV API除了提供由TFDV計算的標準統計資料外,只要該運算可以表示為Apache Beam轉換形式,TFDV API就能進行自定義統計資料計算,這些自定義統計資料在同樣的statistics.proto序列化,還可供下游函式庫使用。在筆記型電腦上,TFDV創建的Apache Beam工作管線,使用DirectRunner執行,而同樣的工作管線也可與其他Runner像是GCP上的DataflowRunner一併發布。Google還提到,Apache Flink和Apache Beam社群也將完成Flink Runner,未來也可以用來執行TFDV創建的Apache Beam工作管線。
在正式的產品環境中使用TFDV,也是使用和筆記型電腦相同的函式庫,進行大規模資料分析和驗證,只是有其特殊的使用案例,包括驗證連續到達的資料以及檢測訓練與服務間的偏差。現在官方已經在GitHub上開源TFDV,其中包括了筆記型電腦環境的範例程式碼。另外,官方也提供了端到端範例,展示了TFDV與TensorFlow Transform、TensorFlow Estimators、TensorFlow Model Analysis和TensorFlow Serving一起使用的方法。
資料來源:ITHOME
網頁設計.RWD響應式網站.企業形象網站 / 服務類
網站技術:PHP
國立台北大學與漸凍人協會合作的專案。一起為漸凍人找回聲音的溫度,專門為漸凍人患者錄製語音,以方便與親友、看護溝通順利。即使是短短簡單的回答,對於漸凍病友來說是多麼困難的一件事,有此功能就可以幫助病友們重拾遺失的溫度。
網頁設計.RWD響應式網站.無障礙網頁 / 農林漁牧類
網站技術:Javascript
致力於花蓮與宜蘭地區的農業事務,像是農作物推廣、技術改良或是新興發展等等。除了推動台灣農作物的發展,也提供民眾遊玩地點,可以體驗農村的好山好水,感受農作物的生長與農民的辛苦。
由於網站的資訊較多,大多皆以文字呈現。將比較重要的區塊額外用區塊獨立在左側,以利閱讀。 當滑鼠移到選單時也會直接就跳出子選單,不用逐筆的去尋找。
精選專案.網頁設計.RWD響應式網站.行動版網站 / 服務類
網站技術:PHP . Javascript . iOS . Android/MySql
協助民眾了解與申請商標的相關流程與資訊,讓客戶加深專利商標這方面的訊息,以過往的案件來加深大眾對於商標的重要性。甚至可以為不同類型客戶量身打造品牌策略服務、分析對手情況...等等服務。
電話:(02)2739-9096 | 傳真:(02)2739-6637 | 客服:[email protected] | 臺北市信義區和平東路3段257號6樓map
© 2019 傑立資訊 All rights reserved.| 網站隱私政策