Ключевые результаты
Исследователи разработали и валидировали инструмент обработки естественного языка (NLP) для выявления метастазов рака молочной железы в легкие на основе анализа патоморфологических заключений. Созданная модель продемонстрировала точность 98%, чувствительность 93% и специфичность 99%. Применение этого инструмента к большой базе данных позволило идентифицировать 1042 пациентов с метастазами в легкие из общей когорты из 12 428 пациентов с раком молочной железы, что составляет 8,4% случаев.
Методология
В данном исследовании был разработан алгоритм обработки естественного языка на основе правил для выявления метастазов рака молочной железы в легкие на основе патологических отчетов. Исследователи использовали базу данных Surveillance, Epidemiology, and End Results (SEER) и данные партнерства California Cancer Registry, охватывающие период с 2000 по 2016 год.
Процесс разработки NLP-инструмента включал следующие этапы:
- Извлечение данных из патологических отчетов и клинической информации пациентов
- Обучение модели на основе ключевых слов и правил для идентификации метастазов в легкие
- Валидация с использованием ручного анализа подвыборки отчетов двумя независимыми экспертами
- Оценка характеристик пациентов с метастазами в легкие по сравнению с другими группами
Для валидации алгоритма была использована случайная выборка из 200 положительных и 100 отрицательных случаев, которые были вручную проверены экспертами.
Клиническое значение
Применение разработанного NLP-инструмента позволило выявить важные клинические характеристики пациентов с метастазами рака молочной железы в легкие:
- Медиана возраста на момент постановки диагноза составила 55 лет
- Гистологические подтипы: инвазивный протоковый рак (71%), инвазивный дольковый рак (9%)
- Рецепторный статус: ER+/HER2- (50%), ER+/HER2+ (17%), ER-/HER2+ (10%), тройной негативный (23%)
- Особенности метастазирования: пациенты с метастазами в легкие чаще имели метастазы в печень (23% против 6% при других локализациях метастазов) и головной мозг (12% против 2%)
- Билатеральные метастазы наблюдались в 65% случаев метастазов в легкие
Анализ показал, что наибольший риск метастазов в легкие имели пациенты с тройным негативным раком молочной железы и HER2-положительным подтипом.
Выводы
Исследователи успешно разработали высокоточный NLP-инструмент для идентификации метастазов рака молочной железы в легкие из патологических отчетов. Данный подход позволяет:
