版面理解和智能標引技術解讀

技術摘要
版式文件的版面理解和智能標引技術:利用了知識工程方法,總結了版式文件中的排版規則,同時參考文字語義信息和版式文件中預制的標引數據,對版面內的數據進行綜合判定,可以高效、較為準確的自動提取出版式文件中的文章、標題、作者、內容、版次等結構化數據。
根據書報刊不同版式的特點,存在不同的處理邏輯和不同的技術手段。

以下內容需要付費方可閱讀
¥50.00付費后查看