實現(xiàn)效果:
該AI智能小程序目前集成了百度AI開放平臺數(shù)十個AI服務產(chǎn)品功能,包括人臉識別、文字識別、表格識別、紅酒識別、貨幣識別、地標識別、手勢識別、商標識別、果蔬識別、菜品識別等圖片識別功能,以及黑白圖像上色、圖片風格變換等圖像處理的功能。
1 系統(tǒng)框架
小程序?qū)⒊S霉δ馨碅i技術分為五大類:文字識別、語音技術、圖像技術、視頻技術和自然語言處理(NLP),然后根據(jù)具體功能再進行細分。本文主要介紹百度AI開放平臺計算機視覺方面服務產(chǎn)品的測試過程及效果。通過微信小程序?qū)崿F(xiàn)API調(diào)用。小程序?qū)⒂脩羯蟼鞯膱D片提交給百度AI服務,返回識別結(jié)果。全部功能都在小程序客戶端完成,不需要服務器,適合個人開發(fā)者學習調(diào)試使用,同時也為商業(yè)應用提供相應解決方案。
開發(fā)平臺:微信開發(fā)者工具 V1.02
開發(fā)語言:java script
測試環(huán)境:Andriod 9.0
2 微信小程序開發(fā)過程
2.1注冊微信小程序
注冊地址:https://mp.weixin.qq.com/cgi-bin/registermidpage?action=index&lang=zh_CN
注冊成功后在開發(fā)->開發(fā)者ID里找到AppID,這是開發(fā)微信小程序所需要的身份標識。然后填寫服務器域名,需要用到的均要填上,如下圖。
2.2 小程序的配置已基本完成,下一步需要下載開發(fā)工具了,微信自己開發(fā)的IDE,下載地址是:
https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html
2.3小程序開發(fā)文檔:https://developers.weixin.qq.com/miniprogram/dev/framework/
2.4小程序開發(fā)界面
如下圖,標紅處需要填入注冊時獲得的APPID。
2.5程序總體結(jié)構(gòu)
Pages下的每個文件夾對應實現(xiàn)一種AI功能。添加新的AI功能,比如添加駕駛證識別功能,在根目錄的全局配置文件app.json中增加:"pages/ driving_license/ driving_license",會自動創(chuàng)建相關頁面文件夾,其內(nèi)部結(jié)構(gòu)如下:
driving_license.js:功能邏輯模塊
driving_license.wxss:頁面樣式文件
driving_license.wxml:頁面布局文件
driving_license.json:頁面配置文件
3 程序功能實現(xiàn)說明
想了解微信小程序中百度API接口的調(diào)用過程,請參看我之前的帖子:
當然,還有更多百度AI服務功能可以陸續(xù)添加,按照以上文章鏈接所提供的方法稍作修改即可。有興趣的同學可以試試。
4 測試效果
以下選取了部分圖片識別的測試效果:
4.1菜品識別
4.2 車型識別
4.3地標識別
4.4動物識別
4.5紅酒識別
4.6 貨幣識別
4.7 植物識別
4.8 黑白圖像上色
4.9 清點人數(shù)
4.10 通用物體與場景識別
5 測試結(jié)論
5.1識別能力
根據(jù)拍攝照片,識別圖片內(nèi)容,廣泛應用于娛樂類APP,自助結(jié)算等業(yè)務場景中。目前圖像識別具備的識別能力如下:
品牌logo識別:識別4萬種商品logo,支持定制logo圖庫
植物識別:識別2萬多種通用植物和近8千種花卉
動物識別:識別近8千種動物
菜品識別:識別超過近九千種菜品,支持定制菜品圖庫
地標識別:識別5萬中外著名地標、景點
果蔬識別:識別近千種水果和蔬菜
紅酒識別:識別數(shù)十萬中外紅酒名稱及詳細介紹
貨幣識別:識別國內(nèi)外常見貨幣,支持正反面、紀念鈔
車型識別:識別3千款常見車型,可返回車型百科信息
營業(yè)執(zhí)照識別:識別各版式營業(yè)執(zhí)照所有關鍵字段
增值稅發(fā)票識別:識別增值稅普票或?qū)F彼?0個字段
駕駛證識別:識別機動車駕駛證正本所有9個字段
車牌識別:識別藍牌、綠牌、單/雙行黃牌等類型車牌
手寫文字識別:識別圖片中的手寫數(shù)字、手寫中文
表格文字識別:識別表頭、表尾及每個單元格的文字內(nèi)容
人臉檢測:返回人臉框與關鍵點,識別多種人臉屬性
手勢識別:識別24種常見手勢,支持自拍、他人拍攝
5.2 特色優(yōu)勢
1)圖像識別功能豐富
支持多種垂類業(yè)務場景的細粒度圖像識別,精準識別超過十萬種物體和場景,基于百度海量數(shù)據(jù),持續(xù)豐富接口返回內(nèi)容信息。
2)識別準確性高
基于百度豐富的海量數(shù)據(jù),利用深度學習技術及精準的算法迭代模型,不斷提高準確性。
3)工作穩(wěn)定性好
提供24小時云端高穩(wěn)定服務,宕機率低,故障恢復快,單圖毫秒級響應,服務可用性高達99.95%。
4)支持定制化識圖
支持根據(jù)不同的業(yè)務場景定制客戶專屬的AI識圖能力,滿足非通用場景下的業(yè)務需求。例如品牌logo,菜品識別均可自定義庫。
5)支持獲取百科信息
支持識別結(jié)果中返回百度百科的內(nèi)容,讓客戶業(yè)務功能更完善、內(nèi)容更豐富。
作者:wangwei8638
- 為什么年輕人不愛換手機了
- 柔宇科技未履行金額近億元被曝已6個月發(fā)不出工資
- 柔宇科技被曝已6個月發(fā)不出工資 公司回應欠薪有補償方案
- 第六座“綠動未來”環(huán)保公益圖書館落地貴州山區(qū)小學
- 窺見“新紀元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進,核心技術決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領域達成戰(zhàn)略合作伙伴關系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。