[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • 深度實踐OCR:基於深度學習的文字識別
    該商品所屬分類:計算機/網絡 -> 計算機/網絡
    【市場價】
    440-638
    【優惠價】
    275-399
    【作者】 劉樹春、賀 盼、馬建奇、王佳軍 
    【所屬類別】 圖書  計算機/網絡  人工智能  深度學習與神經網絡 
    【出版社】機械工業出版社 
    【ISBN】9787111654049
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:16開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787111654049
    作者:劉樹春、賀盼、馬建奇、王佳軍

    出版社:機械工業出版社
    出版時間:2020年05月 

        
        
    "

    產品特色

    編輯推薦

    讀者對像:


    1.人工智能領域的技術工程師,尤其是從事圖像識別和NLP的技術工程師;


    2.專門研究OCR的專業人士或院校師生等。


    (1)作者陣容豪華,由阿裡巴巴本地生活研究院算法團隊技術專家領銜,海康威視、趣頭條等企業的算法專家以及知名場景文本算法作者共同撰寫;


    (2)行業應用和學術理論相結合,既有來自於阿裡巴巴本地生活實際應用場景的一線實踐經驗和方法,又有來自學術前沿的新理論;


    (3)本書得到了阿裡巴巴本地生活、達摩院、曠視科技、字節跳動、狗尾草等知名AI企業或機構的知名AI技術專家的聯袂推薦;


    (4)本書不僅講解了OCR的組件、方法、算法、實現,而且還介紹了學術界*前沿的文字檢測和文字識別方法。

     
    內容簡介
    這是一部融合了企業界先進工程實踐經驗和學術界前沿技術和思想的ORC著作。
    本書由阿裡巴巴本地生活研究院算法團隊技術專家領銜,從組件、算法、實現、工程應用等維度繫統講解基於深度學習的OCR技術的原理和落地。書中一步步剖析了算法背後的數學原理,提供大量簡潔的代碼實現,幫助讀者從零基礎開始構建OCR算法。
    全書共10章:
    第1章從宏觀角度介紹了ORC技術的發展歷程、概念和產業應用;
    第2章講解了OCR的圖像預處理方法;
    第3~4章介紹了傳統機器學習方法和深度學習的相關基礎知識;
    第5章講解了基於傳統方法和深度學習方法的OCR的數據生成;
    第6章講解了與OCR相關的一些高級深度學習方法,方便讀者理解後續的檢測和識別部分;

    這是一部融合了企業界先進工程實踐經驗和學術界前沿技術和思想的ORC著作。


    本書由阿裡巴巴本地生活研究院算法團隊技術專家領銜,從組件、算法、實現、工程應用等維度繫統講解基於深度學習的OCR技術的原理和落地。書中一步步剖析了算法背後的數學原理,提供大量簡潔的代碼實現,幫助讀者從零基礎開始構建OCR算法。


    全書共10章:


    第1章從宏觀角度介紹了ORC技術的發展歷程、概念和產業應用;


    第2章講解了OCR的圖像預處理方法;


    第3~4章介紹了傳統機器學習方法和深度學習的相關基礎知識;


    第5章講解了基於傳統方法和深度學習方法的OCR的數據生成;


    第6章講解了與OCR相關的一些高級深度學習方法,方便讀者理解後續的檢測和識別部分;


    第7章講解了文字的檢測技術,從通用的目標檢測到文字的檢測,一步步加深讀者對文字檢測問題的認識;


    第8章討論了文字識別的相關技術,定位到文字的位置之後,需要對文字的內容進行進一步的解析;


    第9章介紹了一些OCR後處理的方法;


    第10章介紹了一些版面分析方法。

    作者簡介
    劉樹春
    阿裡巴巴本地生活研究院算法專家,前復旦七牛雲聯合實驗室OCR算法負責人,在OCR相關技術的落地和實現方面有深入的研究和豐富的實踐經驗,在菜單識別、車牌檢測識別、卡證識別、商業廣告文字檢測和識別、票據類識別等應用場景中積累了豐富的經驗。曾經組隊參加COCO競賽、ICDAR刷榜等活動,並發表多篇論文。

    賀盼
    佛羅裡達大學在讀博士,擔任 CVPR、ICCV、ECCV等10多家國際頂會審稿人或程序委員,在場景文本領域發表過多篇國際會議論文 (DTRN、CTPN、SSTD等)。曾經在中科院先進技術研究院、港中文、曠視美國研究院等做過相關研究工作,對場景文本有深刻的認識,並且對場景文本學術前沿有很強的感知力。

    馬建奇

    劉樹春


    阿裡巴巴本地生活研究院算法專家,前復旦七牛雲聯合實驗室OCR算法負責人,在OCR相關技術的落地和實現方面有深入的研究和豐富的實踐經驗,在菜單識別、車牌檢測識別、卡證識別、商業廣告文字檢測和識別、票據類識別等應用場景中積累了豐富的經驗。曾經組隊參加COCO競賽、ICDAR刷榜等活動,並發表多篇論文。 


     


    賀盼


    佛羅裡達大學在讀博士,擔任 CVPR、ICCV、ECCV等10多家國際頂會審稿人或程序委員,在場景文本領域發表過多篇國際會議論文 (DTRN、CTPN、SSTD等)。曾經在中科院先進技術研究院、港中文、曠視美國研究院等做過相關研究工作,對場景文本有深刻的認識,並且對場景文本學術前沿有很強的感知力。 


     


    馬建奇


    著名的RRPN算法的作者,發表過多篇國際會議論文,曾經在曠視研究院做過檢測相關的工作,在上海高等研究院做過文字檢測相關的工作,曾經組隊參加過ICDAR 17 MLT比賽,獲得前三名。曾獲Facebook研究實習機會。目前即將開始修讀博士學位,正在做文字識別相關的工作,對於OCR的問題有獨到的見解。 


     


    王佳軍


    阿裡巴巴本地生活研究院高級算法專家,負責本地生活研究院圖像算法團隊的管理、研發等工作,曾經在滴滴研究院做相關算法的研究。業餘時間擔任深度學習框架MXNet的技術專家,對實際算法的落地優化等有非常深入的耕耘,具有很強的OCR相關項目的落地能力。 


     


    謝雨飛


    趣頭條算法工程師,曾在七牛雲做OCR、NLP相關算法的研究工作,發表過多篇國際論文。 


     


    陳明曦


    紐約大學碩士研究生,曾在七牛雲從事OCR相關工作,發表相關論文數篇。

    目錄
    推薦序
    前言
    第1章緒論 1
    1.1人工智能大潮中的OCR發展史 1
    1.1.1傳統OCR方法一般流程 3
    1.1.2基於深度學習OCR方法一般流程 5
    1.2文字檢測 6
    1.3文字識別 8
    1.4產業應用現狀 10
    1.5本章小結 11
    1.6參考文獻 11
    第2章圖像預處理 13
    2.1二值化 13
    2.1.1全局閾值方法 13

    推薦序


    前言


    第1章緒論  1


    1.1人工智能大潮中的OCR發展史  1


    1.1.1傳統OCR方法一般流程  3


    1.1.2基於深度學習OCR方法一般流程  5


    1.2文字檢測  6


    1.3文字識別  8


    1.4產業應用現狀  10


    1.5本章小結  11


    1.6參考文獻  11


    第2章圖像預處理  13


    2.1二值化  13


    2.1.1全局閾值方法  13


    2.1.2局部閾值方法  17


    2.1.3基於深度學習的方法  20


    2.1.4其他方法  22


    2.2平滑去噪  26


    2.2.1空間濾波  26


    2.2.2小波閾值去噪  28


    2.2.3非局部方法  29


    2.2.4基於神經網絡的方法  33


    2.3傾斜角檢測和校正  35


    2.3.1霍夫變換  36


    2.3.2Radon 變換  38


    2.3.3基於 PCA 的方法  38


    2.4實戰  39


    2.5參考文獻  43


    第3章傳統機器學習方法緒論  45


    3.1特征提取方法  45


    3.1.1基於結構形態的特征提取  45


    3.1.2基於幾何分布的特征提取  61


    3.2分類方法模型  63


    3.2.1支持向量機  63


    3.2.2K近鄰算法  65


    3.2.3多層感知器  70


    3.3實戰:身份證號碼的識別  71


    3.3.1核心代碼  71


    3.3.2測試結果  78


    3.4本章小結  79


    3.5參考文獻  79


    第4章深度學習基礎知識  80


    4.1單層神經網絡  80


    4.1.1  80


    4.1.2感知機  81


    4.2雙層神經網絡  82


    4.2.1雙層神經網絡簡介  82


    4.2.2常用的激活函數  83


    4.2.3反向傳播算法  86


    4.3深度學習  87


    4.3.1卷積神經網絡  88


    4.3.2常用優化算法  90


    4.4訓練網絡技巧  92


    4.4.1權值初始化  92


    4.4.2L1/L2正則化  93


    4.4.3Dropout  94


    4.5實戰  95


    4.6參考文獻  97


    第5章數據生成  99


    5.1背景介紹  99


    5.2傳統單字OCR數據生成  100


    5.3基於深度學習的OCR數據生成  101


    5.3.1文字檢測數據的生成  101


    5.3.2檢測圖片生成  103


    5.3.3其他方法  112


    5.3.4識別數據生成  113


    5.4通過GAN的技術生成數據  114


    5.4.1GAN背景介紹  114


    5.4.2GAN的原理  116


    5.4.3GAN的變種  117


    5.5圖像增廣  123


    5.5.1常用的圖像增強方法  123


    5.5.2深度學習方法  126


    5.6常用的開源數據集  128


    5.7ICDAR的任務和數據集  131


    5.8本章小結  138


    5.9參考文獻  138


    第6章深度學習高級方法  140


    6.1圖像分類模型  140


    6.1.1LeNet5  140


    6.1.2AlexNet  142


    6.1.3VGGNet  143


    6.1.4GoogLeNet  144


    6.1.5ResNet  147


    6.1.6DenseNet  151


    6.1.7SENet  153


    6.1.8輕量化網絡  154


    6.2循環神經網絡  154


    6.2.1RNN網絡  154


    6.2.2GRU  156


    6.2.3GRU的實現  158


    6.2.4LSTM網絡  160


    6.3Seq2Seq  163


    6.4CTC Loss  164


    6.4.1算法詳解  166


    6.4.2前向傳播  168


    6.4.3後向傳播  173


    6.4.4前向/後向算法  173


    6.4.5CTC算法特性  174


    6.4.6代碼解析  175


    6.5Attention  178


    6.6本章小結  181


    6.7參考文獻  182


    第7章文字檢測  183


    7.1研究意義  183


    7.2目標檢測方法  185


    7.2.1目標檢測相關術語  186


    7.2.2傳統檢測方法  189


    7.2.3Two-stage 方法  195


    7.2.4One-stage 方法  210


    7.3文本檢測方法  217


    7.3.1傳統文本檢測方法  217


    7.3.2基於深度學習的文本檢測方法  222


    7.4本章小結  228


    7.5參考文獻  228


    第8章字符識別  232


    8.1任務概覽  232


    8.2數據集說明  233


    8.2.1數據集意義  233


    8.2.2常見識別數據集介紹  234


    8.3評測指標  238


    8.3.1編輯距離  239


    8.3.2歸一化編輯距離  239


    8.3.3字符準確度  239


    8.3.4詞準確率  239


    8.3.5語境相關的評測方式  239


    8.4主流算法介紹  240


    8.4.1傳統光學方法  240


    8.4.2完全基於深度學習的方法  244


    8.5CRNN模型實戰  274


    8.5.1簡介  274


    8.5.2運行環境  274


    8.5.3測試部分講解  274


    8.5.4測試運行結果  279


    8.5.5訓練部分  279


    8.5.6用ICDAR2013數據集訓練CRNN模型  282


    8.6本章小結  284


    8.7參考文獻  285


    第9章OCR後處理方法  288


    9.1文本糾錯  288


    9.1.1BK-tree  289


    9.1.2基於語言模型的中文糾錯  293


    9.2文本結構化  297


    9.2.1模板匹配  298


    9.2.2文本分類  300


    9.3本章小結  304


    9.4參考文獻  304


    第10章版面分析  306


    10.1版面分析詳解  306


    10.2復雜版面識別  309


    10.3文檔恢復  310


    10.4本章小結  311


    10.5參考文獻  311

    前言
    ◆推薦序 ◆
    文字識別(OCR)是視覺感知中一個重要的技術,目的是從照片中提取文字信息。這項技術有著廣泛的應用前景。比如,自動駕駛汽車路標識別,或把掃描文檔轉化成結構化的文字信息以方便檢索。近幾年來,隨著深度學習等技術的發展,文字識別相關技術取得了突破性進展,特別是場景文字的檢測、識別和結構化技術。這些技術的發展使得文字識別在工業界受到了廣泛關注。阿裡巴巴、騰訊、百度、谷歌、微軟等互聯網公司都有大規模的文字識別應用,提供了各式各樣的文字識別相關的服務。
    本書繫統地介紹了文字識別的各類方法,內容翔實,包括圖像預處理、數據生成與增強、文字檢測、文字識別以及後處理和結構化等,這些方法是文字識別的基礎。同時,本書還介紹了學習這些方法所必需的一些基礎,比如,殘差神經網絡以及通用目標檢測技術。另外,本書詳細地介紹了這些方法具體的代碼實現,供讀者學習和使用。目前,關於文字識別的專業書籍還比較缺乏,本書將給廣大文字識別研究人員和應用人員帶來便利。
    本書的作者在文字識別學術研究和產業應用方面有豐富的經驗,書中很好地融合了學術理論和產業化實踐。相信本書的出版對於文字識別技術的普及和發展會產生積極的作用。

    ◆推薦序 ◆


    文字識別(OCR)是視覺感知中一個重要的技術,目的是從照片中提取文字信息。這項技術有著廣泛的應用前景。比如,自動駕駛汽車路標識別,或把掃描文檔轉化成結構化的文字信息以方便檢索。近幾年來,隨著深度學習等技術的發展,文字識別相關技術取得了突破性進展,特別是場景文字的檢測、識別和結構化技術。這些技術的發展使得文字識別在工業界受到了廣泛關注。阿裡巴巴、騰訊、百度、谷歌、微軟等互聯網公司都有大規模的文字識別應用,提供了各式各樣的文字識別相關的服務。


    本書繫統地介紹了文字識別的各類方法,內容翔實,包括圖像預處理、數據生成與增強、文字檢測、文字識別以及後處理和結構化等,這些方法是文字識別的基礎。同時,本書還介紹了學習這些方法所必需的一些基礎,比如,殘差神經網絡以及通用目標檢測技術。另外,本書詳細地介紹了這些方法具體的代碼實現,供讀者學習和使用。目前,關於文字識別的專業書籍還比較缺乏,本書將給廣大文字識別研究人員和應用人員帶來便利。


    本書的作者在文字識別學術研究和產業應用方面有豐富的經驗,書中很好地融合了學術理論和產業化實踐。相信本書的出版對於文字識別技術的普及和發展會產生積極的作用。


     


    ——FCOS,CTPN模型作者,田值


     


    前言


    文字作為人類傳播文明、傳遞信息、記錄思想的重要載體,在我們的生活中占據著舉足輕重的地位,所以文字識別是目前受關注的AI技術之一。OCR技術應用非常廣泛,相較於圖像,文字作為抽像的符號,承載著大量的信息,所以識別文字有非常大的價值。從歷史角度看,文字識別是一門古老的技術,但是從實驗室走出來,走進人們的生活,也隻是近些年纔發生的事情。特別是在深度學習應用於文字識別領域後,文字識別精度逼近人工水平,發展出非常多的應用。


    筆者作為機器視覺方面的從業者,在剛開始將的深度學習技術應用到文字識別時遇到很多困難,常常苦惱於市面上鮮有全面介紹文字識別實現原理和方法的資料,特別是中文書籍,即使有,所介紹的技術也非常落後,遠遠脫離產業以及學術前沿。隨著自己不斷地學習和嘗試,在反復試錯以及與同行交流後,慢慢掌握了其中的方法。為了幫助更多與我有相似經歷的人,我們幾位同事把基於深度學習的OCR方法整理出來,希望能幫助更多相關從業人員。


    本書從OCR的出現講到中間經歷的傳統技術,再到的基於深度學習的技術,同時根據OCR常用技術流程——從數據、模型對文字的定位、識別到後處理等,對OCR技術做了一個深度梳理,帶領讀者進入一個引人入勝的文字識別智能世界,領略各種神經網絡的魅力及挑戰。


    全書總共有10章,邏輯上分為四個部分。


    部分(第1~3章),主要介紹傳統OCR技術。


    第二部分(第4~6章),主要介紹OCR中一些基礎的組件和方法。


    第三部分(第7~8章),主要跟蹤前沿的文字檢測和文字識別技術。


    第四部分(第9~10章),主要介紹一些常用的後處理方法和版面分析方法。


    本書在內容上盡可能涵蓋了OCR領域的基礎知識,在合著伙伴的組成上,有學術界梯隊的青年學者,同時也有產業界一線從業者,希望盡可能實現理論與實踐並重。


    寫作分工


    劉樹春編寫第1章、第5章、第6章、第10章。


    賀盼編寫第7章。


    馬建奇編寫第8章。


    王佳軍編寫第9章。


    謝雨飛編寫第3章。


    陳明曦編寫第2章、第4章。


    本書特點


    本書具有如下特點:


    1.作者有學術界的OCR研究者,也有工作在一線的OCR從業者,試圖做到理論與實踐結合。


    2.涵蓋的知識面比較全,包括傳統的OCR方法以及的基於深度學習的OCR方法。


    3.強化了對代碼的梳理,方便讀者實戰運行。


    本書讀者


    本書可作為OCR從業人士或者研究生的參考資料或者入門教程,用來了解OCR相關前沿技術。


    感謝


    本書在後期修訂中得到、張飛雲、劉樹芳、龍力等同仁的幫助。他們抽出寶貴的時間幫忙審閱,並提出了中肯的意見和建議。


    感謝阿裡巴巴本地生活研究院提供的支持與幫助,特別是李佩博士與何田院士對我們工作的鼎力支持。


    感謝機械工業出版社的編輯楊福川、張錫鵬和董惠芝,沒有他們的努力就沒有本書的順利出版。


    後,感謝各位讀者朋友。


    讀者服務


    由於OCR領域的發展日新月異,本書無法做到在所有細分領域面面俱到。而且筆者筆力有限,書中會有很多不足的地方,還望讀者能夠幫忙指正,不勝感激,日後定將勤加修訂升級。


    本書通過GitHub(https://github.com/ocrbook/ocrinaction)進行各種資源的交互,以及信息的反饋。


    謝謝大家!


     


    劉樹春

    媒體評論

    本書繫統介紹了OCR的各類方法,既包括圖像預處理、數據生成與增強、文字檢測與識別等基礎內容,又有與神經網絡和目標檢測相結合的進階內容。作者團隊在學術研究和產業應用方面的經驗都非常豐富。


    ——田值 FCOS/CTPN模型作者


     


    隨著深度學習的廣泛應用,OCR技術歷久彌新,*近幾年取得了脫胎換骨的進展。阿裡巴巴本地生活提供了各種線上線下融合的場景,催生了如菜單識別、小票識別、招牌識別、包裝文字識別等富有生活味道的需求,對 OCR 技術提出了新的挑戰。本書將OCR 的前沿理論與行業應用深度結合,能幫助讀者更好地理解和掌握*的OCR 技術。
    ——李佩 阿裡巴巴本地生活研究院高級總監


     


    作為繫統性講解OCR的專業書籍,本書彙集了阿裡本地生活研究院技術團隊對深度學習領域OCR的理論研究和實踐經驗,可讀性和實操性俱佳,是相關專業學生和從業者不可多得的一本工具書。
    ——魏秀參 曠視南京研究院院長


     


    文字識別改變內容的表達和交互方式,是各行業信息化和數字化的基礎,在多媒體內容理解、人工輔助駕駛、無障礙信息交流等方向都發揮著不可或缺的作用。本書講解了文字識別技術的理論和方法,兼顧入門讀者和進階讀者的需求。同時,書中分享了大量應用案例和實戰經驗,能幫助讀者實現AI場景落地。
    ——王永攀 阿裡達摩院讀光OCR負責人


     


    相較於圖像信息,文字信息更加直接、易用。識別圖像中的文字,是很多AI應用的非常關鍵的一步。本書不僅包括文字識別相關的理論和算法,還包括很多技術落地方面的實踐和應用,幫助圖像算法工程師少走彎路,快速學習。
    ——邵傑 字節跳動AI實驗室資深研究員


     


    圖像識別是計算機視覺領域非常重要的研究方向,傳統的機器學習方法主要關注圖像內容的挖掘,如果能夠識別出圖像中的文字,對於圖像的理解和後續的應用都有非常大的幫助。本書不僅講解了機器學習和深度學習的基礎知識,闡述了文字識別的相關理論和算法,更重要的是,還給出了技術實踐和應用,可以幫助圖像算法工程師快速學習和落地文字識別繫統。
    ——邵浩  狗尾草人工智能研究院院長















     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部