Beta OCR + AI-помощник по документам

От скана
до ответа.

Распознаём документы и собираем их в рабочее пространство, где легко находить ответы и сравнивать содержимое. ПДн остаются у вас в браузере, обезличенный текст — на серверах в РФ.

Серверы в РФ
152-ФЗ
ПДн в браузере
d2t Анализ от 5 сек
ПДн обезличены
app.doc2text.ru/space/buhgalteriya-2025
Документы · 47
УПД УПД-1247.pdf
УПД УПД-1248.pdf
АКТ Акт-октябрь.pdf
КС2 КС-2_объект-47.pdf
ДОГ Договор № 47.pdf
+ Загрузить ещё
Ответ
Найдено 3 документа с расхождением по НДС более 100 ₽:

УПД-1247 — заявлено 62 900 ₽, расчётно 62 916 ₽ 1
УПД-1253 — заявлено 114 200 ₽, расчётно 114 380 ₽ 2
УПД-1267 — заявлено 48 100 ₽, расчётно 47 720 ₽ 3
1 УПД-1247.pdf · ООО «Стройсервис» стр. 1
2 УПД-1253.pdf · ООО «Стройсервис» стр. 1
94.5%
точность на сложных таблицах
от 5с
обработка одной страницы
авто·
обезличивание ПДн до индекса
0
ПДн в нашем хранилище
Как это работает

Четыре шага
от файла до ответа

Один и тот же пайплайн для всех документов — независимо от того, нужно вам разовое распознавание или собрать рабочее пространство из 200 файлов.

01

Загрузка

Перетаскиваете PDF, скан, фото или pack из нескольких файлов. До 200 МБ за раз. Документ попадает в RAM, на диск не пишется.

PDF · JPG · PNG · TIFF
02

Распознавание

Мультимодальная модель видит структуру: текст, заголовки, таблицы со сложными ячейками. Возвращает Markdown.

Markdown · JSON · XLSX
03

Обезличивание

Находим ПДн — ФИО, паспорта, ИНН, адреса — и заменяем на токены. Реальные значения сохраняются у вас в браузере.

Локально · в РФ
04

Поиск и анализ

Обезличенный текст индексируется в вашем рабочем пространстве. Ищите по смыслу, сравнивайте, выдёргивайте таблицы из десятков документов.

Со ссылками на источники
Что внутри

Три вещи, которые
мы делаем хорошо

Не пытаемся быть универсальным OCR на всё. Сфокусированы на трёх вещах, на которых остальные часто проигрывают.

01 · Точность

Сложные таблицы

Многоуровневые заголовки, объединённые ячейки, перевёрнутые и многостраничные сканы. Мультимодальная модель видит структуру, а не только символы.

Наименование
Сумма, ₽
1.1
Земляные работы
184 320
1.2
Устройство фундамента
892 100
1.3
Армирование
247 800
02 · Приватность

ПДн остаются у вас

Языковая модель находит и заменяет персональные данные на токены до того, как текст попадает в индекс. Реальные значения — только у вас в браузере.

Иванов И.И.
[ФИО_001]
📦 индекс
03 · Использование

Готово к работе

Markdown для отправки в ваш LLM, XLSX для бухгалтерии, DOCX для редактирования, JSON для разработчиков. Структура и заголовки сохраняются.

Markdown XLSX DOCX JSON CSV
Рабочее пространство

Анализируйте содержимое
своих документов

Загрузите документы один раз — находите ответы на любые вопросы. Сравнивайте редакции договоров, ищите расхождения в первичке, выдёргивайте ключевые цифры из тендерной документации. Каждый ответ — со ссылкой на конкретное место в исходнике.

Найди все УПД за октябрь, где сумма НДС не совпадает с расчётной (>100 ₽).
Ответ

Найдено 3 документа с расхождением по НДС более 100 ₽:

Документ
Заявлено
Расчётно
УПД-1247 · 15.10
62 900 ₽
62 916 ₽
УПД-1253 · 18.10
114 200 ₽
114 380 ₽
УПД-1267 · 27.10
48 100 ₽
47 720 ₽

Источники: УПД-1247.pdf УПД-1253.pdf УПД-1267.pdf

Задайте свой вопрос…
Кому подойдёт

Под ваши документы
и ваши задачи

doc2text работает с любыми документами, но особенно силён там, где у обычных OCR начинаются проблемы: нестандартные формы, длинные таблицы, специфические форматы.

Первичка под одним поиском

Загрузите УПД, акты и накладные за месяц или квартал — сразу ищите расхождения по контрагентам, суммам и датам. Подходит для бухгалтеров без 1С: выдаёт чистый XLSX или JSON для любой системы.

  • УПД, счёт-фактура, ТОРГ-12
  • Акты выполненных работ, ТТН
  • Кассовые и товарные чеки
  • Банковские выписки
«Нашла все УПД, где в номенклатуре была опечатка — 6 штук из 200. Раньше это занимало часа три, сейчас — две минуты.»
— Бухгалтер, малый бизнес
УПД-1247.pdf
Обезличено
Поставщик: [ОРГ_001]
ИНН/КПП: [ИНН_001] / [КПП_001]
Дата: 15.10.2025
Сумма: 377 400 ₽
НДС: 62 900 ₽ (расч.: 62 916)
↑ ПДн заменены на токены, реальные значения подставляются на вашей стороне

КС-2 и сметы без ручной перебивки

Загрузите сметы, акты КС-2, КС-3 и тендерную документацию — таблицы с объединёнными ячейками, вложенной нумерацией и переносами на десятки страниц превращаются в структурированные данные. Сравнивайте позиции и расценки между документами одним вопросом.

  • Сметы, КС-2, КС-3
  • Тендерная документация по 44-ФЗ и 223-ФЗ
  • Договоры подряда и допсоглашения
  • Ведомости объёмов работ
«Сверил ведомость объёмов из тендера с нашей сметой — нашёл три позиции с расхождениями ещё до подачи заявки.»
— Сметчик, подрядная организация
КС-2_объект-47.pdf
Обезличено
Подрядчик: [ОРГ_001]
Заказчик: [ОРГ_002]
Раздел 2. Монтажные работы
Поз. 2.4 — объём: 38,5 м²
Итого по акту: 1 284 600 ₽
↑ Структура таблицы сохранена: разделы, позиции, объёмы, итоги

Договоры и материалы дел под одним поиском

Загрузите пакет договоров или материалы дела — задавайте вопросы и получайте ответы с цитатами из конкретных пунктов. ФИО и реквизиты доверителей обезличиваются до индексации: реальные данные не покидают ваш браузер.

  • Договоры и допсоглашения
  • Судебные акты и исковые заявления
  • Доверенности и протоколы
  • Корпоративные документы
«Проверила 40 договоров аренды на автопролонгацию — нашлись два, о которых все забыли.»
— Юрист, консалтинг
Договор_аренды_№47.pdf
Обезличено
Арендодатель: [ОРГ_001]
В лице: [ФИО_001]
Срок: до 31.12.2026
Пролонгация: автоматическая
Неустойка: 0,1 % в день
↑ ФИО и реквизиты — токены; словарь подстановки только в вашем браузере

Первичка и отчётность без бухгалтера в штате

Чеки, акты сверки, выписки и накладные — сфотографируйте или загрузите PDF, получите аккуратные таблицы и итоги. Платите за страницы разово: без подписки, абонентской платы и установки программ.

  • Акты сверки с контрагентами
  • Кассовые и товарные чеки
  • Банковские выписки
  • Накладные и счета
«Разобрал коробку чеков за квартал для налоговой за один вечер — раньше откладывал неделями.»
— ИП, розничная торговля
Акт_сверки_Q2.pdf
Обезличено
Контрагент: [ОРГ_001]
ИНН: [ИНН_001]
Сальдо на 01.04: 84 300 ₽
Сальдо на 30.06: 96 300 ₽
Расхождение: 12 000 ₽
↑ Готово к выгрузке в XLSX или CSV одним кликом
Безопасность

Ваши данные
остаются вашими

Мы построили инфраструктуру так, чтобы у нас физически не оставалось ваших персональных данных после обработки. Это не маркетинг — это архитектурное решение.

01

Обезличивание перед сохранением

До того как обезличенный текст попадёт в индекс рабочего пространства, языковая модель находит и заменяет ПДн — ФИО, паспорта, ИНН, адреса, телефоны — на токены. Реальные значения возвращаются только в ваш браузер.

02

Серверы в РФ

Вся обработка — на инфраструктуре Yandex Cloud в Москве. Соответствует требованиям 152-ФЗ к локализации персональных данных. Политика обработки ПДн, согласие и договор-оферта опубликованы — ссылки в подвале.

03

Прозрачность

Документация по архитектуре открыта. Список найденных и обезличенных ПДн доступен вам в каждом документе. На Enterprise — гарантия в договоре + on-prem полностью в вашем контуре.

Тарифы

Простые цены.
Без сюрпризов.

Платите за страницы разово или оформите подписку с AI-чатом. Бесплатно при регистрации — первые 5 страниц, со скачиванием, без карты.

Старт
499
единоразово
  • 50 страниц
  • Действует 6 месяцев
  • Сложные таблицы и структура
  • Обезличивание ПДн под 152-ФЗ
  • Экспорт во все форматы
Купить пакет
Стандарт
2 099
единоразово
  • 300 страниц
  • ≈ 7 ₽ за страницу
  • Действует 6 месяцев
  • Сложные таблицы и структура
  • Обезличивание ПДн под 152-ФЗ
  • Экспорт во все форматы
Купить пакет
Макс
4 999
единоразово
  • 1 000 страниц
  • 5 ₽ за страницу — лучшая цена
  • Действует 6 месяцев
  • Приоритетная обработка
  • Обезличивание ПДн под 152-ФЗ
  • Экспорт во все форматы
Купить пакет
Стартовый
990
в месяц
  • 500 страниц в месяц
  • До 2 рабочих пространств
  • Сложные таблицы и структура
  • Обезличивание ПДн под 152-ФЗ
  • Экспорт во все форматы
  • Без AI-чата
Оформить
Бизнес
9 990
в месяц
  • 5 000 страниц в месяц
  • AI-чат с цитатами (1 000 вопросов)
  • Без ограничений по пространствам
  • Приоритетная обработка
  • Обезличивание ПДн под 152-ФЗ
Оформить
Вопросы

Что обычно спрашивают

Как именно обезличиваются ПДн?
После распознавания языковая модель находит в тексте персональные данные — ФИО, паспорта, ИНН, СНИЛС, телефоны, адреса, email — и заменяет их на токены вида [ФИО_001], [ИНН_001] и т.д. В индекс рабочего пространства попадает только обезличенный текст. Словарь подстановок (токен → реальное значение) сохраняется у вас в браузере. При отображении ответа на ваш вопрос реальные значения подставляются обратно на вашей стороне. Если вы откроете рабочее пространство с другого устройства без словаря — увидите токены вместо ПДн.
Можно ли доверять ответам — а если модель что-то выдумает?
Каждый ответ сопровождается ссылками на конкретные места в документах — кликаете и видите подсветку в исходнике. Если модель не находит точного ответа в ваших документах, она прямо говорит об этом, а не пытается сочинить. Тем не менее, мы рекомендуем перепроверять числовые расчёты и юридически значимые формулировки по исходникам. Уровень уверенности модели по каждому ответу также показывается в интерфейсе.
Что с серверами и 152-ФЗ?
Серверы расположены на инфраструктуре Yandex Cloud в Москве — это закрывает требование о локализации ПДн граждан РФ. После обезличивания в нашей базе остаётся только обезличенный текст, который юридически уже не считается персональными данными по статье 3 п.9 152-ФЗ. Это и юридически чисто, и снижает риск утечки. Политика обработки ПДн и договор-оферта опубликованы — ссылки в подвале.
Какие документы и форматы вы поддерживаете?
На вход — PDF, JPG, PNG, TIFF, HEIC, многостраничные сканы. На выход — TXT, DOCX, XLSX, CSV, JSON, Markdown. Распознаём печатный текст, таблицы со сложной структурой, повёрнутые и многостраничные сканы. Поддерживаем русский, английский и большинство кириллических языков.
Как считаются страницы и сколько их помещается в пространство?
Учёт постраничный, а не по числу документов. Количество страниц известно сразу при загрузке: для PDF — до распознавания, изображение считается за одну страницу. Списываем с баланса при обработке и возвращаем страницу обратно, если распознавание не удалось. Рабочих пространств — до 2 на Стартовом, до 5 на Профессиональном и без ограничений на Бизнесе; внутри пространства можно собирать сколько угодно документов в пределах баланса страниц. Закончились страницы — докупите пакет (Старт, Стандарт или Макс) или оформите подписку.
Как происходит оплата?
Оплата через Robokassa — банковские карты (Visa / MasterCard / Мир) и СБП. Два варианта: разовые пакеты страниц (Старт 499 ₽, Стандарт 2 099 ₽, Макс 4 999 ₽) — платите один раз, страницы действуют 6 месяцев, на каждую покупку приходит кассовый чек «полный расчёт» по 54-ФЗ; либо ежемесячная подписка с автопродлением, которую можно отменить в любой момент. Начать можно бесплатно — первые 5 страниц при регистрации, без карты.
А если у меня очень специфичные документы?
Из коробки модель хорошо справляется со сложными таблицами, повёрнутыми сканами и нестандартными бланками. Если у вас особенно специфичный поток документов или нужна установка в собственном контуре — напишите нам на hello@doc2text.ru, обсудим вариант под вашу задачу.
Готовы попробовать?

Распознайте первый
документ прямо сейчас

Без регистрации, без карты. Загрузите файл — увидите результат через секунду.