Необходимо зарегистрироваться, чтобы получить доступ к полным текстам статей и выпусков журналов!
- Название статьи
- Модель машинного обучения для решения регрессионных задач, связанных с выявлением действий ботов-накрутчиков
- Авторы
- Пителинский Кирилл Владимирович yekadath@gmail.com, канд. техн. наук, доцент, МВА, доцент кафедры "Информационная безопасность", ФГАОУ ВО «Московский политехнический университет», Москва, Россия
Бритвина Валентина Валентиновна saaturn2015@mail.ru, канд. пед. наук, доцент кафедры "Инфокогнитивные технологии", Московский политехнический университет, Московский политехнический университет
Боброва Екатерина Олеговна kotei_katrin@mail.ru, ассистент кафедры "Информационная безопасность", ФГАОУ ВО «Московский политехнический университет», Москва, Россия
Калуцкий Игорь Владимирович kalutsky_igor@mail.ru, канд. техн. наук, доцент, заведующий кафедрой "Информационная безопасность", ФГАОУ ВО «Московский политехнический университет», Москва, Россия
Савенков Виктор Викторович savenckoa2015@gmail.com, студент кафедры "Инфокогнитивные технологии", ФГАОУ ВО «Московский политехнический университет», Москва, Россия
Агоштинью Адау Какулу adcaculo@gmail.com, аспирант кафедры «Управление и информатика в технических системах», ФГБОУ ВО «Московский технологический университет «Станкин», Москва, Россия
- В разделе
- ТЕХНИЧЕСКАЯ ЗАЩИТА ИНФОРМАЦИИ. Управление доступом
- Ключевые слова
- боты-накрутчики / посещаемость веб-сайта / поведенческие факторы / информационная безопасность / машинное обучение / нейронные сети / LSTM / слой внимания / временные ряды / прогнозирование / градиентный бустинг
- Год
- 2024 номер журнала 2 Страницы 3 - 11
- Индекс УДК
- 004:519.2: 338.27
- Код EDN
- HHIUWS
- Код DOI
- 10.52190/2073-2600_2024_2_3
- Финансирование
- Тип статьи
- Научная статья
- Аннотация
- Выполнено комплексное исследование в области прогнозирования посещаемости веб-сайтов с использованием машинного обучения. Отмечена важность анализа посещаемости сайтов для своевременного выявления начала вредоносной деятельности ботов-накрутчиков поведенческих факторов, снижающих в итоге рейтинг информационного ресурса в поисковых системах. Предложена кастомная архитектура нейронной сети (НС), основанной на слоях LSTM и слое внимания, специально разработанной для обработки временных рядов. Рассмотрены слои LSTM и внедрение слоя внимания для фокусировки на ключевых показателях. Изучена эволюция моделей начиная от простых рекуррентных НС и введения слоя Embedding до перехода к более сложным архитектурам. Приведены этапы обучения модели от подбора гиперпараметров до оценки результатов на тестовых данных в целях достижения баланса между производительностью и ресурсами обучения. Проведена оценка модели по средней абсолютной и среднеквадратичной ошибкам. Разработанная модель сравнена с градиентным бустингом и выявлены преимущества НС. Указаны перспективы для будущих исследований и для повышения качества анализа динамики посещаемости веб-сайтов посредством машинного обучения.
- Полный текст статьи
- Для прочтения полного текста необходимо купить статью
- Список цитируемой литературы
-
Goodfellow I., Bengio Y., Courville A. Deep Learning. - MIT Press. 2016. Р. 305-307.
Vaswani A., Shazeer N., Parmar N. et al. Attention Is All You Need. In Advances in Neural Information Processing Systems. 2017. - 15 р.
Brockwell P. J., Davis R. A. Introduction to Time Series and Forecasting. - Springer. 2016. - 425 р.
Percival D. B., Walden A. T. Wavelet Methods for Time Series Analysis. - Cambridge University Press. 2000. - 594 p.
Gardner E. S. Exponential smoothing: The state of the art // Journal of Forecasting, 25(4), 2006. Р. 303-354.
Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2016. -13 р.
Understanding LSTM Networks. August 27, 2015. [Электронный ресурс] http://colah.github.io/posts/2015-08-Understanding-LSTMs/
Mikolov T., Chen K., Corrado G., Dean J. Efficient Estimation of Word Representations in Vector Space. arXiv preprint arXiv:1301.3781. 2013. - 12 р.
- Купить
- 500.00 руб