- title: Программируемые NER компоненты
excerpt: В данной заметке мы продолжим говорить о NER компонентах и попытаемся определить условия, в которых нам начинает недоставать функционала стандартных компонентов и стоит задуматься о программировании своих собственных...
author: Сергей Камов
publish_date: February 25, 2021
avatar_url: images/sergey_kamov_avatar.png
twitter_id: apachenlpcraft
href_target: habr
ru: true
- title: Поиск по синонимам в тексте — контролируем процесс или доверяемся нейросетям
excerpt: Первое что нужно сделать при разработке поисковых, диалоговых и прочих систем, основанных на natural language processing — это научиться разбирать тексты пользовательских запросов и находить в них сущности рабочей модели. Задача нахождения стандартных сущностей (geo, date, money и т.д.) в целом уже решена, остается лишь выбрать подходящий NER компонент и воспользоваться его функционалом. Если же вам нужно найти элемент, характерный для вашей конкретной модели или вы нуждаетесь в улучшенном качестве поиска стандартного элемента, придется создать свой собственный NER компонент или обучить какой-то уже существующий под свои цели...
author: Сергей Камов
publish_date: January 28, 2021
avatar_url: images/sergey_kamov_avatar.png
twitter_id: apachenlpcraft
href_target: habr
ru: true
- title: Composable Named Entities
url: /blogs/composable_named_entities.html
excerpt: Most of the NLP tasks start with the basic challenge - how to find or detect something in the text. Whether you are designing a search engine, conversational interface or some sort of classificator you will likely start with a problem of how to detect named entities in the input text. These named entities can be universal such as dates, countries, cities as well as domain specific for your model. It is also important to note that we are talking about a class of NLP tasks where you actually know what you are looking for...
author: Aaron Radzinski
publish_date: January 20, 2021
avatar_url: images/lion.jpg
twitter_id: aaron_radzinski
href_target: _self
- title: Преобразование текстовых запросов в SQL
excerpt: Большинство разработчиков, когда-либо сталкивавшихся с NLP задачами, рано или поздно задумывались над проблемой, обозначенной в заголовке статьи. Решений подобного рода создавалось достаточное количество, каждое со своими особенностями, плюсами и минусами. Первое, с которым мы с коллегами встретились лет 10 назад, и ссылку на которое я не смог сейчас даже найти, было оформлено в виде абсолютно нечитаемой диссертации. Мы честно, шаг за шагом пытались прорваться сквозь ее страницы, но отчаялись и утратили интерес к данной тематике на несколько лет. Но, рано или поздно к этой проблеме возвращаешься...
author: Сергей Камов
publish_date: January 11, 2021
avatar_url: images/sergey_kamov_avatar.png
twitter_id: apachenlpcraft
href_target: habr
ru: true
- title: Проектируем интенты с Apache NlpCraft
excerpt: В данной заметке я продолжу знакомить читателей с возможностями проекта Apache NlpCraft. Данная статья посвящена вопросу проектирования интентов при построении диалоговых систем. Напомню, что такое интент. Интент — это сочетание функции и правила, по которому эта функция должна быть вызвана. Правило — это чаще всего шаблон, основанный на наборе ожидаемых именованных сущностей в тексте запроса. В большинстве существующих диалоговых систем данный шаблон — это просто список элементов...
author: Сергей Камов
publish_date: December 21, 2020
avatar_url: images/sergey_kamov_avatar.png
twitter_id: apachenlpcraft
href_target: habr
ru: true
- title: Как найти что-то в тексте
excerpt: Найти объект или распознать понятие в тексте — с этого начинается решение большинства NLP задач. Если вы проектируете поисковую систему, создаете голосового помощника или классифицируете пользовательские запросы, прежде всего вы должны разобрать входной текст и попытаться найти в нем именованные сущности, которые могут быть универсальными, такими как даты, страны и города, или специфичными для конкретной модели. Обратите внимание, мы сейчас говорим лишь о тех видах задач, для которых заранее известно, что именно вы ищете или что может встретиться в тексте...
author: Сергей Камов
publish_date: December 1, 2020
avatar_url: images/sergey_kamov_avatar.png
twitter_id: apachenlpcraft
href_target: habr
ru: true
- title: Quick Introduction to Apache NLPCraft
url: /blogs/quick_intro_apache_nlpcraft.html
excerpt: In this short article I would like to introduce Apache NLPCraft - an open source library for adding Natural Language Interface to any application. The goal of this project from its inception in 2017 was and still is unambiguously straightforward - provide an efficient & highly productive API to develop advanced NLP-based interfaces for modern applications...
author: Aaron Radzinski
avatar_url: images/lion.jpg
publish_date: November 16, 2020
twitter_id: aaron_radzinski
href_target: _self
- title: Краткий обзор системы Apache NlpCraft
excerpt: Цель проекта — тотальное упрощение доступа к возможностям NLP (Natural Language Processing) разработчикам приложений. Основная идея системы — это уловить баланс между простотой вхождения в NLP проблематику и поддержкой широкого диапазона возможностей промышленной библиотеки. Задача проекта бескомпромиссна — простота без упрощения...
author: Сергей Камов
publish_date: November 8, 2020
avatar_url: images/sergey_kamov_avatar.png
twitter_id: apachenlpcraft
href_target: habr
ru: true
- title: Short-Term Memory - Maintaining Conversation Context
url: /blogs/short_term_memory.html
excerpt: Short-Term Memory (STM), a technique used to maintain conversational context in NLPCraft. Maintaining the proper conversation context - remembering what the current conversation is about - is essential for all human interaction and thus essential for computer-based natural language understanding...
author: Aaron Radzinksi
avatar_url: images/lion.jpg
publish_date: July 26, 2019
twitter_id: aaron_radzinski
href_target: _self