Настройка классификации с помощью запросов к API
<< Click to Display Table of Contents >> Интеллектуальные возможности > Сервисы Directum Ario > Адаптация сервисов Ario под бизнес-задачи компании > Настройка классификации Настройка классификации с помощью запросов к API |
![]() ![]() ![]() |
Для классификации документов обучается классификатор, в результате чего формируется модель классификации. В поставку сервисов Directum Ario входят обученные классификаторы по типам документов и первых страниц.
Иногда требуется создание и обучение нового классификатора по типам. Например, если:
•организация работает с типами документов, которые не входят в перечень классифицируемых;
•в организации принято оформление документов, отличное от общепринятых форматов.
В процессе работы также можно дообучать базовые модели классификации из поставки. Например, когда:
•нужно «научить» классификатор распознавать дополнительные классы документов;
•в организации появились новые формы документов для уже существующих классов;
•нужно повысить точность классификации, добавив к исходной выборке новые документы тех же классов.
Разница обучения и дообучения состоит в том, что:
•при обучении нет исходных данных, модель обучается «с нуля»;
•при дообучении к результатам обучения на первичных документах добавляются результаты обучения на вновь подобранных документах.
Как правило, классификатор содержит несколько моделей классификации, так как в результате каждого цикла обучения и дообучения формируется новая, улучшенная модель, но только одна из них может быть действующей.
Чтобы обучить или дообучить модель классификации, используйте один из способов:
•укажите путь к папке с документами. Используется для обучения многоклассового классификатора;
•передайте CSV-файла;
•укажите путь к папке с CSV-файлом.
Последние два способа чаще используются при обучении и дообучении многозначного классификатора, но подходят и для многоклассового.
ВАЖНО. Обучение классификатора возможно при наличии минимум двух новых классов документов. Время обучения зависит от количества документов.
Порядок обучения и дообучения классификатора с помощью запросов к API
1.Cоздайте классификатор. Если дообучаете существующий классификатор, пропустите шаг. Для каждого типа классификации, например по типам документов, по типу финансовой услуги или по предмету спора, нужно создавать и обучать свой классификатор. 2.Подготовьте набор документов. Важно. Документы, на которых обучался или дообучался классификатор, нужно хранить. Используйте их при следующих дообучениях, чтобы не потерять прогресс предыдущих обучений. 3.Обучите или дообучите модель классификации. При дообучении учитывайте ограничения. 4.Проанализируйте результаты обучения или дообучения. 5.Протестируйте классификатор с помощью запроса на классификацию файла. ПРИМЕЧАНИЕ. Для объективной оценки работы классификатора выбирайте документ, относящийся к одному из видов, на которых обучен классификатор. При этом документ не должен входить в исходную выборку для обучения. 6.Перенесите модели в продуктивный контур и опубликуйте их. |
© Компания Directum, 2024 |