Ai

通用文字識別（簡體中文）

通用場景文字提取，通過返回圖片中文字內容與坐標位置等信息，便於客戶進行比對或結構化操作。支持識別簡體中文、英文、數字和常用符號。

通用文字識別（繁體中文）

通用場景文字提取，通過返回圖片中文字內容與坐標位置等信息，便於客戶進行比對或結構化操作。支持識別繁體中文、英文、數字和常用符號。

自定義模板文字識別

客戶可自定義OCR模板，提取卡證票據中結構化文字信息，並以鍵值對應關系的形式展現結果。

車牌信息識別

檢測常見機動車號牌，並識別其中的車牌號。

人臉檢測

識別人臉面部特征，將檢測到的五官與輪廓關鍵點信息映射到64個矢量坐標上。

人臉相似度比對

通過兩張人臉圖片中的特征向量計算余弦相似度作為置信度，根據置信度比較，從而判斷是否為同一個人。

人體結構化屬性

識別輸入圖片中的人體區域，並返回每個區域人體位置坐標及屬性分析，如性別、年齡、服飾等16種屬性的語義信息。

智能人像分割

基於AI深度學習框架識別圖像中的人體輪廓，實現高精度分割，使之與背景進行分離。

圖像相似度

比較兩幅圖片是否相似，通過圖片特征向量計算余弦距離，並轉化為置信度，根據置信度比較兩張圖片的相似性。

通用物體識別

檢測圖像中的通用對象主體，返回該對象主體的區域信息與置信度。支持識別300類物體。

色情內容檢測

自動對圖片進行審核，獲取多維度色情量化信息，如：normal，sexy，porn，實現精準快速的色情傾向判斷。

圖像超分辨率

可將圖片智能放大2或4倍，從而獲取清晰度更高、細節豐富的圖像。

文本相似度

比較兩段不同文本之間相似度，並輸出一個介於0到1之間的置信度，根據置信度比較兩段文字的相似性。

更多智能AI

讓生活更輕鬆

卡片和證書

識別卡片和證書（例如身份證、護照、銀行卡、大學文憑和名片）上的文字。

• 實時服務

文件

準確識別文檔和表格上的文字。

• 在幾毫秒內返回結果

工作訂單

識別票證上的文字並返回結構化文本，改善在線處理。

• 快速識別

手寫筆跡

識別手寫的漢字、字母、數字和標點符號。

• 免費試用• 快速識別

圖像搜尋

在自訂圖片庫中搜尋與您上載的圖像相似或相同的圖像。

• 處理大量數據• 可定製服務

影像分類

識別圖像中具有高精度的元素，以增強相冊管理和分類搜尋等場景。

• 支持數以千計的標籤

智能視覺製作

改善圖像的處理和分析，增強第三方應用程式的性能，提供更好的用戶體驗。

• 一鍵式智能摳圖• 高效圖像處理

圖像搜尋

在自訂圖片庫中搜尋與您上載的圖像相似或相同的圖像。

• 處理大量數據• 可定製服務

多媒體人工智能

提供智能解決方案，支持視頻評論、版權保護、視頻搜尋推薦等場景。

• 不同場景下的內容識別

內容理解

分析視頻素材並選擇素材或剪輯作為視頻縮略圖。

• 語義理解

影片摳圖

Mats圖像以高清視頻顯示，支持涵蓋電影和電視、娛樂和社交應用的場景。

• 高精度

影片處理

在互聯網上生成、處理、優化和總結長視頻或短視頻的內容。

• 兼容性高

實時語音轉錄

實時識別不同長度的音頻流中的語音，提供文本輸出。

•低延遲和對方言的高精度支持

記錄文件識別

識別記錄的文件並將語音轉換為文字。

• 多種訪問模式• 基於場景的模型

短句識別

在一分鐘以內的音頻剪輯中近乎實時識別語音。

• 近乎實時識別• 超高併發

語音模型自學解決方案

提供語音模型的多合一自學習解決方案，提升特定業務領域的語音識別準確率。

• 互動體驗• 公共雲用戶免費

短文本

合成短文本的語音，實現基於語音的人機交互，增加交互的靈活性，完美模仿人類語音。

• 類似人類的語音• 靈活的配置

長文本

合成1,000字以上的語音，支持各種場景。

• 基於場景的語言• 成本效益

自訂語音

基於小數據量，以自訂文本到語音功能快速合成語音。

• 少量數據• 深度定製

發音評估

使用語音技術自動評估發音並檢測和糾正錯誤。

• 中英雙語支持• 免費試用

智能語音互動解決方案

提供端到端的智能語音交互解決方案，例如音頻處理、喚醒詞識別、語音識別和語音合成，這些解決方案可以集成到客戶產品中。

• 多終端SDK• 軟硬件集成模塊

便攜多合一智能語音裝置

革新傳統的轉錄服務，以解決長期以來在速度、完整性和人工成本方面的挑戰。

• 離線服務• 自學模式

基本服務

為企業和開發人員提供核心文本分析和挖掘工具。

• 多種部署方法• 功能全面

自然語言自學平臺

幫助您快速創建和使用自訂算法模型進行自然語言處理。

• 專業技術• 端到端優化

地址清理

清理地址數據，使企業和政府機構能夠實現地址標準化。

• 多種部署方法• 多種形式的地址

產品評審分析

區分24個行業的正面和負面產品評論。

• 以大量數據訓練模型• 各種粒度

招投標文件分析

分析招投標文件，提取20多個字段的資訊，如費用和各方。

• 以大量數據訓練模型• 各個領域

簡歷識別與分析

從英文簡歷中識別並提取多達10個字段，或者從中文簡歷中提取27個字段。

• 中英雙語支持• 各個領域

通用版

翻譯在各種場景中用於一般目的（例如人機對話）的語言。

• 214種語言• 多個垂直領域

專業版

開發基於註意力的神經網絡模型，提供專業的翻譯解決方案。

• 雙語詞庫• 專業領域的雙語術語

圖像翻譯

識別並翻譯圖像中的文字，並將翻譯後的文字添加到圖像中。

•不同的形式• 在線編輯

文件翻譯

將文檔中的文字翻譯成特定的語言，並生成新的文檔，並在新的文檔中對翻譯的文字進行排版。

• 靈活的引擎選擇• 多種格式

跨境電子商務翻譯

在跨境電商場景下翻譯並優化文字。

• 10年電子商務經驗• 全方位優化

人機協同翻譯平臺

提供數十個文檔、圖像、視頻的翻譯服務，提高翻譯效率。

• 自動項目管理• 語言質量保證

內容審查

識別圖像、視頻、音頻文件和文本等多媒體內容中的風險。

• 高精度• 定製服務

智能營銷

OpenSearch

提供用於開發智能搜尋服務的綜合平臺和開放的分佈式引擎。

• 多個行業的專業技術• 高性能

智能推薦(AIRec)

提供基於電子商務、內容、直播和社交媒體經驗的定製資訊流

• 多種解決方案的靈活配置

智能客戶服務

對話型人工智能

此解決方案提供先進的AI服務，使組織能夠透過多個渠道構建AI支持的類似於人類的對話型多語言聊天機械人，以全天候快速回應客戶。

智能機械人

透過各類一系列用戶端實現基於自然語言處理的智能對話的平臺。