Beta OCR + AI-помощник по документам

От скана —
до ответа.

Распознаём документы и собираем их в рабочее пространство, где легко находить ответы и сравнивать содержимое. ПДн остаются у вас в браузере, обезличенный текст — на серверах в РФ.

Распознать документ → Рабочее пространство →

Серверы в РФ

152-ФЗ

ПДн в браузере

d2t Анализ от 5 сек

ПДн обезличены

app.doc2text.ru/space/buhgalteriya-2025

найди все УПД с расхождением по НДС ⌘ K

Ответ

Найдено 3 документа с расхождением по НДС более 100 ₽:

УПД-1247 — заявлено 62 900 ₽, расчётно 62 916 ₽ 1
УПД-1253 — заявлено 114 200 ₽, расчётно 114 380 ₽ 2
УПД-1267 — заявлено 48 100 ₽, расчётно 47 720 ₽ 3

1 УПД-1247.pdf · ООО «Стройсервис» стр. 1

2 УПД-1253.pdf · ООО «Стройсервис» стр. 1

94.5%

точность на сложных таблицах

от 5с

обработка одной страницы

авто·

обезличивание ПДн до индекса

ПДн в нашем хранилище

Как это работает

Четыре шага
от файла до ответа

Один и тот же пайплайн для всех документов — независимо от того, нужно вам разовое распознавание или собрать рабочее пространство из 200 файлов.

Загрузка

Перетаскиваете PDF, скан, фото или pack из нескольких файлов. До 200 МБ за раз. Документ попадает в RAM, на диск не пишется.

PDF · JPG · PNG · TIFF

Распознавание

Мультимодальная модель видит структуру: текст, заголовки, таблицы со сложными ячейками. Возвращает Markdown.

Markdown · JSON · XLSX

Обезличивание

Находим ПДн — ФИО, паспорта, ИНН, адреса — и заменяем на токены. Реальные значения сохраняются у вас в браузере.

Локально · в РФ

Поиск и анализ

Обезличенный текст индексируется в вашем рабочем пространстве. Ищите по смыслу, сравнивайте, выдёргивайте таблицы из десятков документов.

Со ссылками на источники

Что внутри

Три вещи, которые
мы делаем хорошо

Не пытаемся быть универсальным OCR на всё. Сфокусированы на трёх вещах, на которых остальные часто проигрывают.

01 · Точность

Сложные таблицы

Многоуровневые заголовки, объединённые ячейки, перевёрнутые и многостраничные сканы. Мультимодальная модель видит структуру, а не только символы.

№

Наименование

Сумма, ₽

1.1

Земляные работы

184 320

1.2

Устройство фундамента

892 100

1.3

Армирование

247 800

02 · Приватность

ПДн остаются у вас

Языковая модель находит и заменяет персональные данные на токены до того, как текст попадает в индекс. Реальные значения — только у вас в браузере.

Иванов И.И.

→

[ФИО_001]

→

📦 индекс

03 · Использование

Готово к работе

Markdown для отправки в ваш LLM, XLSX для бухгалтерии, DOCX для редактирования, JSON для разработчиков. Структура и заголовки сохраняются.

Markdown XLSX DOCX JSON CSV

Рабочее пространство

Анализируйте содержимое
своих документов

Загрузите документы один раз — находите ответы на любые вопросы. Сравнивайте редакции договоров, ищите расхождения в первичке, выдёргивайте ключевые цифры из тендерной документации. Каждый ответ — со ссылкой на конкретное место в исходнике.

Бухгалтерия: расхождения по НДС

Стройка: сравнение смет

Юристы: ключевые даты в договоре

Найди все УПД за октябрь, где сумма НДС не совпадает с расчётной (>100 ₽).

Ответ

Найдено 3 документа с расхождением по НДС более 100 ₽:

Документ

Заявлено

Расчётно

УПД-1247 · 15.10

62 900 ₽

62 916 ₽

УПД-1253 · 18.10

114 200 ₽

114 380 ₽

УПД-1267 · 27.10

48 100 ₽

47 720 ₽

Источники: УПД-1247.pdf УПД-1253.pdf УПД-1267.pdf

Задайте свой вопрос…

Кому подойдёт

Под ваши документы
и ваши задачи

doc2text работает с любыми документами, но особенно силён там, где у обычных OCR начинаются проблемы: нестандартные формы, длинные таблицы, специфические форматы.

Бухгалтерия

Стройка и тендеры

Юристы

ИП и малый бизнес

Первичка под одним поиском

Загрузите УПД, акты и накладные за месяц или квартал — сразу ищите расхождения по контрагентам, суммам и датам. Подходит для бухгалтеров без 1С: выдаёт чистый XLSX или JSON для любой системы.

УПД, счёт-фактура, ТОРГ-12
Акты выполненных работ, ТТН
Кассовые и товарные чеки
Банковские выписки

«Нашла все УПД, где в номенклатуре была опечатка — 6 штук из 200. Раньше это занимало часа три, сейчас — две минуты.»

— Бухгалтер, малый бизнес

УПД-1247.pdf

Обезличено

Поставщик: [ОРГ_001]

ИНН/КПП: [ИНН_001] / [КПП_001]

Дата: 15.10.2025

Сумма: 377 400 ₽

НДС: 62 900 ₽ (расч.: 62 916)

↑ ПДн заменены на токены, реальные значения подставляются на вашей стороне

КС-2 и сметы без ручной перебивки

Загрузите сметы, акты КС-2, КС-3 и тендерную документацию — таблицы с объединёнными ячейками, вложенной нумерацией и переносами на десятки страниц превращаются в структурированные данные. Сравнивайте позиции и расценки между документами одним вопросом.

Сметы, КС-2, КС-3
Тендерная документация по 44-ФЗ и 223-ФЗ
Договоры подряда и допсоглашения
Ведомости объёмов работ

«Сверил ведомость объёмов из тендера с нашей сметой — нашёл три позиции с расхождениями ещё до подачи заявки.»

— Сметчик, подрядная организация

КС-2_объект-47.pdf

Обезличено

Подрядчик: [ОРГ_001]

Заказчик: [ОРГ_002]

Раздел 2. Монтажные работы

Поз. 2.4 — объём: 38,5 м²

Итого по акту: 1 284 600 ₽

↑ Структура таблицы сохранена: разделы, позиции, объёмы, итоги

Договоры и материалы дел под одним поиском

Загрузите пакет договоров или материалы дела — задавайте вопросы и получайте ответы с цитатами из конкретных пунктов. ФИО и реквизиты доверителей обезличиваются до индексации: реальные данные не покидают ваш браузер.

Договоры и допсоглашения
Судебные акты и исковые заявления
Доверенности и протоколы
Корпоративные документы

«Проверила 40 договоров аренды на автопролонгацию — нашлись два, о которых все забыли.»

— Юрист, консалтинг

Договор_аренды_№47.pdf

Обезличено

Арендодатель: [ОРГ_001]

В лице: [ФИО_001]

Срок: до 31.12.2026

Пролонгация: автоматическая

Неустойка: 0,1 % в день

↑ ФИО и реквизиты — токены; словарь подстановки только в вашем браузере

Первичка и отчётность без бухгалтера в штате

Чеки, акты сверки, выписки и накладные — сфотографируйте или загрузите PDF, получите аккуратные таблицы и итоги. Платите за страницы разово: без подписки, абонентской платы и установки программ.

Акты сверки с контрагентами
Кассовые и товарные чеки
Банковские выписки
Накладные и счета

«Разобрал коробку чеков за квартал для налоговой за один вечер — раньше откладывал неделями.»

— ИП, розничная торговля

Акт_сверки_Q2.pdf

Обезличено

Контрагент: [ОРГ_001]

ИНН: [ИНН_001]

Сальдо на 01.04: 84 300 ₽

Сальдо на 30.06: 96 300 ₽

Расхождение: 12 000 ₽

↑ Готово к выгрузке в XLSX или CSV одним кликом

Безопасность

Ваши данные
остаются вашими

Мы построили инфраструктуру так, чтобы у нас физически не оставалось ваших персональных данных после обработки. Это не маркетинг — это архитектурное решение.

Обезличивание перед сохранением

До того как обезличенный текст попадёт в индекс рабочего пространства, языковая модель находит и заменяет ПДн — ФИО, паспорта, ИНН, адреса, телефоны — на токены. Реальные значения возвращаются только в ваш браузер.

Серверы в РФ

Вся обработка — на инфраструктуре Yandex Cloud в Москве. Соответствует требованиям 152-ФЗ к локализации персональных данных. Политика обработки ПДн, согласие и договор-оферта опубликованы — ссылки в подвале.

Прозрачность

Документация по архитектуре открыта. Список найденных и обезличенных ПДн доступен вам в каждом документе. На Enterprise — гарантия в договоре + on-prem полностью в вашем контуре.

Тарифы

Простые цены.
Без сюрпризов.

Платите за страницы разово или оформите подписку с AI-чатом. Бесплатно при регистрации — первые 5 страниц, со скачиванием, без карты.

Пакеты страниц Подписки

Старт

499 ₽

единоразово

50 страниц
Действует 6 месяцев
Сложные таблицы и структура
Обезличивание ПДн под 152-ФЗ
Экспорт во все форматы

Купить пакет

Стандарт

2 099 ₽

единоразово

300 страниц
≈ 7 ₽ за страницу
Действует 6 месяцев
Сложные таблицы и структура
Обезличивание ПДн под 152-ФЗ
Экспорт во все форматы

Купить пакет

Макс

4 999 ₽

единоразово

1 000 страниц
5 ₽ за страницу — лучшая цена
Действует 6 месяцев
Приоритетная обработка
Обезличивание ПДн под 152-ФЗ
Экспорт во все форматы

Купить пакет

Стартовый

990 ₽

в месяц

500 страниц в месяц
До 2 рабочих пространств
Сложные таблицы и структура
Обезличивание ПДн под 152-ФЗ
Экспорт во все форматы
Без AI-чата

Оформить

Профессиональный

2 990 ₽

в месяц

1 500 страниц в месяц
AI-чат с цитатами (300 вопросов)
Рабочее пространство
До 5 пространств
Приоритетная обработка
Автопродление, отмена в любой момент

Оформить подписку

Бизнес

9 990 ₽

в месяц

5 000 страниц в месяц
AI-чат с цитатами (1 000 вопросов)
Без ограничений по пространствам
Приоритетная обработка
Обезличивание ПДн под 152-ФЗ

Оформить

Вопросы

Что обычно спрашивают

Как именно обезличиваются ПДн?

После распознавания языковая модель находит в тексте персональные данные — ФИО, паспорта, ИНН, СНИЛС, телефоны, адреса, email — и заменяет их на токены вида [ФИО_001], [ИНН_001] и т.д. В индекс рабочего пространства попадает только обезличенный текст. Словарь подстановок (токен → реальное значение) сохраняется у вас в браузере. При отображении ответа на ваш вопрос реальные значения подставляются обратно на вашей стороне. Если вы откроете рабочее пространство с другого устройства без словаря — увидите токены вместо ПДн.

Можно ли доверять ответам — а если модель что-то выдумает?

Каждый ответ сопровождается ссылками на конкретные места в документах — кликаете и видите подсветку в исходнике. Если модель не находит точного ответа в ваших документах, она прямо говорит об этом, а не пытается сочинить. Тем не менее, мы рекомендуем перепроверять числовые расчёты и юридически значимые формулировки по исходникам. Уровень уверенности модели по каждому ответу также показывается в интерфейсе.

Что с серверами и 152-ФЗ?

Серверы расположены на инфраструктуре Yandex Cloud в Москве — это закрывает требование о локализации ПДн граждан РФ. После обезличивания в нашей базе остаётся только обезличенный текст, который юридически уже не считается персональными данными по статье 3 п.9 152-ФЗ. Это и юридически чисто, и снижает риск утечки. Политика обработки ПДн и договор-оферта опубликованы — ссылки в подвале.

Какие документы и форматы вы поддерживаете?

На вход — PDF, JPG, PNG, TIFF, HEIC, многостраничные сканы. На выход — TXT, DOCX, XLSX, CSV, JSON, Markdown. Распознаём печатный текст, таблицы со сложной структурой, повёрнутые и многостраничные сканы. Поддерживаем русский, английский и большинство кириллических языков.

Как считаются страницы и сколько их помещается в пространство?

Учёт постраничный, а не по числу документов. Количество страниц известно сразу при загрузке: для PDF — до распознавания, изображение считается за одну страницу. Списываем с баланса при обработке и возвращаем страницу обратно, если распознавание не удалось. Рабочих пространств — до 2 на Стартовом, до 5 на Профессиональном и без ограничений на Бизнесе; внутри пространства можно собирать сколько угодно документов в пределах баланса страниц. Закончились страницы — докупите пакет (Старт, Стандарт или Макс) или оформите подписку.

Как происходит оплата?

Оплата через Robokassa — банковские карты (Visa / MasterCard / Мир) и СБП. Два варианта: разовые пакеты страниц (Старт 499 ₽, Стандарт 2 099 ₽, Макс 4 999 ₽) — платите один раз, страницы действуют 6 месяцев, на каждую покупку приходит кассовый чек «полный расчёт» по 54-ФЗ; либо ежемесячная подписка с автопродлением, которую можно отменить в любой момент. Начать можно бесплатно — первые 5 страниц при регистрации, без карты.

А если у меня очень специфичные документы?

Из коробки модель хорошо справляется со сложными таблицами, повёрнутыми сканами и нестандартными бланками. Если у вас особенно специфичный поток документов или нужна установка в собственном контуре — напишите нам на hello@doc2text.ru, обсудим вариант под вашу задачу.

Готовы попробовать?

Распознайте первый
документ прямо сейчас

Без регистрации, без карты. Загрузите файл — увидите результат через секунду.

Распознать документ → Рабочее пространство →

От скана —до ответа.

Четыре шагаот файла до ответа

Загрузка

Распознавание

Обезличивание

Поиск и анализ

Три вещи, которыемы делаем хорошо

Сложные таблицы

ПДн остаются у вас

Готово к работе

Анализируйте содержимоесвоих документов

Под ваши документыи ваши задачи

Первичка под одним поиском

КС-2 и сметы без ручной перебивки

Договоры и материалы дел под одним поиском

Первичка и отчётность без бухгалтера в штате

Ваши данныеостаются вашими

Обезличивание перед сохранением

Серверы в РФ

Прозрачность

Простые цены.Без сюрпризов.

Что обычно спрашивают

Распознайте первыйдокумент прямо сейчас

От скана —
до ответа.

Четыре шага
от файла до ответа

Три вещи, которые
мы делаем хорошо

Анализируйте содержимое
своих документов

Под ваши документы
и ваши задачи

Ваши данные
остаются вашими

Простые цены.
Без сюрпризов.

Распознайте первый
документ прямо сейчас