Чем ближе к вокзалу (или станции метро) - тем хуже шашлык (проверено): Data Science на страже фастфуда.
Наткнулся на интересную статью, автор которой провел нетривиальное исследование, подтверждающее старую теорию: чем ближе к вокзалу — тем хуже качество кебаба (применимо и к шашлыку с шавермой).
И как проводилось исследование?
Сбор данных был проведен с помощью OSINT-инструментов (Парсинг открытых данных из OpenStreetMap и Wikipedia для составления списка станций; Google Maps API для получения геолокаций кебаб-ресторанов в радиусе 1 км от станций; Парсинг с использованием Python и Beautiful Soup для извлечения дополнительных сведений (часы работы, отзывы и рейтинги)).
Анализ данных состоял из 3х моментов:
Статистика: Применение χ²-теста для проверки гипотезы «возле каждой станции есть кебабная».
Геоаналитика: Визуализация плотности точек через QGIS и Python (библиотеки geopandas, folium) для картографирования распределения.
Кластеризация: Алгоритм DBSCAN для выявления «кебабных хабов» вне зоны непосредственного влияния станций.Валидация данных проводилась с помощью ручной проверка выборки для устранения ложных срабатываний API с учетом погрешностей GPS и ограничений данных OSM.
И что в итоге?
93% станций имеют хотя бы одну кебабную (шашлычку) в пешей доступности. И да, исследование подтвердило, что чем ближе расположена шашлычка к станции, тем ниже качество её продукции. (там, конечно, еще осталось место для дискуссий, но как и везде)
Зачем это нужно?
Ну во первых чтоб закончить травиться шаурмой на вокзале.😁
А во вторых это исследование демонстрирует, как даже «несерьёзные» данные можно анализировать с помощью современных методов Data Science. Оно подтверждает, что инфраструктурные факторы (например, близость к вокзалу) могут влиять не только на количество, но и на качество предлагаемых услуг, а также, что все в этом мире причинно-условно.
Подписывайтесь на мой канал - Neko.Play.Panic(), делюсь там мыслями, интересными находками и новостями о всяком.