Ollama-OCR:基於 Ollama 多模態大模型的端到端文檔解析和處理
基本介紹Ollama-OCR 是一個 Python 的 OCR 解析庫,結合了 Ollama 的模型能力,可以直接處理 PDF 文件無需額外轉換,輕鬆從掃描版或原生 PDF 文檔中提取文本和數據。根據使用的視覺模型和自定義提示詞,Ollama-OCR 可支持多種語言,並且能把文檔轉換爲特定的格式進行輸出。支持多種視覺模型———–可以從 Ollama 上選擇最新的視覺模型: ● gem ⌘ Read more

⤋ Read More

Participate

Login to join in on this yarn.