Сервисы ИИ для парсинга документов, чтения чертежей и сопоставления данных

admin

Какие сервисы помогут с чтением и преобразованием технических документов? Добавляйте ниже.

https://fractalgpt.ru/info
_______________________
CAD with AI — сервис для генерации 3D-моделей для использования в системах автоматизированного проектирования (САПР). Нейросеть создает объекты из простого текстового запроса. Доступна система координат и настройка размеров модели с повторной генерацией. Экспорт результатов доступен только в формате .stl.
Особенности CAD with AI:
Создание моделей. CAD with AI сократит время разработки трехмерных моделей для задач проектирования. Используйте текстовое описание объекта на английском языке для генерации 3D-модели. Для ознакомления с возможностями AI-инструмента на сайте сервиса присутствуют несколько примеров запросов. Нажатие на иконку в правом верхнем углу окна предпросмотра модели вызывает систему координат, которую разрешается перемещать.
Настройка размеров. После завершения генерации CAD-модели доступны размеры всех элементов. Все размеры можно изменять и запросить создание объекта с новыми параметрами.
Экспорт. Результаты работы нейросети можно загрузить в формате STL для дальнейшего использования в специализированном программном обеспечении.
CAD with AI можно использовать бесплатно.
______________________
AI CAD Generator — нейросеть для создания 3D-объектов для систем автоматизированного проектирования. Сервис предназначен для ускорения процесса разработки трёхмерных моделей, которые в дальнейшем будут импортированы в выбранное CAD-приложение. Доступен экспорт в различных форматах и API с подробной документацией.

Особенности AI CAD Generator:
Генерация CAD-моделей. AI CAD Generator использует алгоритмы машинного обучения для анализа огромного массива данных и создания моделей, готовых к использованию в приложениях для проектирования. После получения результата модель можно вращать и приближать прямо в браузере, чтобы оценить качество генерации. В ближайшее время разработчики обещают добавить возможность обучения нейросети на своих данных для получения наиболее релевантных результатов.
Простота использования. Интерфейс AI CAD Generator предоставляет удобный способ взаимодействия с системой, позволяя пользователям создавать сложные механические модели, просто используя текстовые описания. Для использования инструмента не потребуется никаких навыков проектирования.
Возможности экспорта. После генерации модели доступен экспорт в следующих формате: FBX, OBJ, GLB, GLTF, PLY, STL и STEP. Используйте полученные файлы для своих проектов.
AI CAD Generator создаёт модели бесплатно. Использование API предусмотрено за дополнительную плату.
_______________________________________________
Docling: Мощный инструмент для анализа и преобразования документов
https://github.com/DS4SD/docling
Docling — это гибкое и удобное решение для парсинга документов с поддержкой множества популярных форматов и легким экспортом в нужный формат.
Основные возможности
Поддержка популярных форматов документов (PDF, DOCX, PPTX, изображения, HTML, AsciiDoc, Markdown) с экспортом в Markdown и JSON
Углубленный анализ PDF-документов, включая макет страниц, порядок чтения и таблицы
Унифицированный и выразительный формат DoclingDocument для представления данных
Извлечение метаданных: заголовок, авторы, ссылки, язык и многое другое
Интеграция с LlamaIndex и LangChain для мощных RAG / QA приложений
Поддержка OCR для сканированных PDF
Удобный интерфейс CLI
_______________________
Оцифровка https://beorg.ru/tech-docs/
_______________________
Новая архитектура поиска, использующая комбинацию нейросетей и векторных баз данных, обеспечивает повышенную релевантность выдачи, предлагая именно тот предмет, который изображён на фото
С определением объектов wildberries помогает детектор YOLO, а для векторизации найденных объектов производился выбор из самых актуальных эмбединговых моделей с HuggingFace. Мы решили остановиться на BLIP-2 и DinoV2, которые объединили и дообучили на 5 млн изображений и 950 млн параметров.
маркетплейс поиск изображений
это не Google Объектив
_______________________
Компании, предоставляющие услуги компьютерного зрения на заказ, создают и обучают модели машинного обучения для оптического распознавания символов.
преобразовать физический документ в редактируемый PDF-файл;
обнаружить, распознать и подсчитать специальные символы или объекты, присутствующие в документе (что важно для чертежей и поэтажных планов, планировок и т.д.);
обнаружить и распознать изображения;
Системы OCR на основе моделей ИИ, также известные как интеллектуальные OCR, обеспечивают гораздо лучшие результаты при распознавании документов, чем традиционные, снижая количество ошибок и увеличивая скорость обработки. Распознавание документов с помощью ИИ помогает компаниям оцифровывать документы, которые раньше были сложны для систем OCR (например, чертежи, поэтажные планы, рукописные документы и т.д.).
https://www.technologika.ru/blog/machine-learning-for-floor-plan-recognition чтение чертежей
Но чтобы научить ИИ "рисовать" чертежи, нужны специальные "учителя". Такой "учитель" должен быть не только классным инженером, он должен грамотно интерпретировать задачу, и понимать, как работает с задачей ИИ, т.е. три в одном.
________________________
Нейросеть, которая перенесет чертежи в 3D-модели. Theia справится за минуты. Есть анализатор документов с оценкой пригодности деталей. https://vk.com/video-65161729_456239652
https://vk.com/wall-65161729_46046
➡ https://spare-parts-3d.com/theia-beta/ beta версия
________________________
Alpha3D — сервис для генерации трёхмерных моделей. Современная платформа предлагает создание качественных 3D-объектов не только из изображения, но и с помощью текстовых описаний. Сгенерированные 3D-модели могут быть использованы на платформах дополненной реальности (AR), виртуальной реальности (VR) и в метавселенной.

Особенности Alpha3D:
Генерация 3D. Сервис значительно облегчит жизнь специалистам по 3D-моделированию, используя ИИ-технологии для генерации трёхмерных объектов. Alpha3D поддерживает 2 способа создания моделей: из текстового описания и изображения. Сервис предоставляет API, что позволяет интегрировать 3D-активы в сторонние приложения. Интуитивно понятный интерфейс делает Alpha3D доступным для пользователей без опыта в 3D-моделировании.
Высокая скорость. Alpha3D обеспечивает создание трёхмерной моделей за считанные минуты, что значительно сокращает время по сравнению с традиционными методами моделирования.
Качество. Нейросеть генерирует трёхмерные модели высокого качества. Создаваемые 3D-активы подходят для использования в AR, VR и метавселенных, обеспечивая реалистичное отображение объектов.
Alpha3D предоставляет 500 кредитов при регистрации. Каждая генерация обойдётся в 10 кредитов. Загрузить модель обойдётся в 500 кредитов, следовательно, без подписки это сделать не получится. API доступен только по подписке Enterprise.
___________________________
TripoSR — бесплатная нейросеть для преобразования 2D-изображений в 3D-объекты. Сервис разработан Stability AI в сотрудничестве с Tripo AI. После создания 3D-модели из фото с помощью нейросети вы можете экспортировать результат в форматах GLB и OBJ. Также присутствует опция удаления фона и API с подробной документацией.

Особенности TripoSR:
2D в 3D. Для создания трёхмерных объектов потребуются навыки работы в специализированных приложениях и приличное количество времени. TripoSR избавит вас от хлопот при разработке 3D-моделей. Загрузите изображение, и нейросеть конвертирует его в 3D-объект. Кроме того, при экспорте вы можете выбрать один из двух форматов: GLB или OBJ. Настоятельно рекомендуется использовать изображения с чётко различимым основным объектом.
Дополнительные настройки. Если вас не устраивает результат создания 3D из фото нейросетью, вы можете попробовать изменить параметр «Foreground Ratio». Это может помочь улучшить результат. Также присутствует опция удаления фона, которая в некоторых случаях сделает результат более качественным.
API. Сервис размещён на платформе Hugging Face, поэтому нейросеть для конвертации 2D-изображений в 3D-модели можно внедрить в своё приложении с помощью API. Документацию по использования API с помощью Python и JavaScript вы найдёте на сайте.
Создать 3D-модель из фото нейросетью можно абсолютно бесплатно.
_________________________
Tripo AI — нейросеть для генерации 3Д-моделей. Сервис является одним из лучших решений на рынке в данной сфере. Нейросеть генерирует 3D из текстовых запросов и изображений. В случае использования текстовых промптов сервис создаёт 4 варианта, любой из которых вы можете улучшить. Результат можно загрузить в формате GLB.

Особенности Tripo AI:
Генератор 3D-моделей. Почувствуйте силу современных технологий с помощью Tripo AI. Нейросеть генерирует 3Д-модели из текстового запроса с достаточно высокой скоростью для такой сложной задачи. Сервис прекрасно справится с генерацией предметов, персонажей и других элементов. После завершения работы вы можете оценить результат со всех сторон и загрузить в формате GLB.
Режимы работы. Нейросеть умеет генерировать 3Д не только из текстовых инструкций, а также из изображений. Загрузите фотографию или картинку, и она будет обработана алгоритмами искусственного интеллекта.
Улучшение моделей. После генерации 3Д-модели нейросетью вы можете запросить улучшение объекта. Это потребует некоторого количества времени, но вы получите результат высокого качества.
На данный момент нейросеть генерирует 3Д-модели бесплатно, но в месяц можно скачать до 10 результатов в высоком качестве. Для большей скорости работы и 100 моделей в высоком качестве потребуется подписка за $29.99.
______________________________

Autodesk разработала программный продукт (Fusion 360 Ultimate и Netfabb)
_________________________________________________
Чего мы хотим от универсальной CV модели?
1. Image-level understanding: понимание высокоуровневой семантики. Например, на картинке кошка или собака? Можно так же сказать, что это способность связать изображение и текстовое описание. Эту задачу отлично решает CLIP.
2. Region/pixel-level recognition: обнаружение объектов на изображениях и понимание их расположения. С этим отлично справляются supervised классификаторы, детекторы и сегментаторы.
3. Fine-grained visual-semantic alignment: связь между областями изображения, в том числе совсем маленькими, и текстом. Обнаружение частей изображений которые относятся к фразам, объектам, атрибутам и отношениям. Это способность обнаружить и отличить "нос собаки", "нос собаки слева", "нос рыжей собаки", "коричневый нос собаки" и так далее.
Когда желания определены дело за малым: выбрать данные, функцию ошибки и архитектуру. Через эти компоненты мы по факту формируем оптимизационную задачу.
Авторы решили, что для получения трех компонент понимания изображений нужно много разных аннотаций, которые можно распределить по двум осям:
1. Spatial hierarchy: аннотации должны включать разные масштабы изображений, чтобы модели требовалось понимание и на уровне изображения, и на уровне пикселей.
2. Semantic granularity: в текстах (описаниях, промптах, лейблах) должны встречаться разные уровни абстракции, требующие от модели как понимания общих концептов, так и небольших деталей и нюансов.
> arxiv.org/abs/2311.06242 # Florence-2
__________________________________________________________

Добавьте информации ниже