Обучение с подкреплением (Reinforcement Learning): Мы можем использовать обучение с подкреплением, чтобы обучить системы искусственного интеллекта, как принимать решения на основе наград или наказаний. Например, система искусственного интеллекта может быть вознаграждена за действия, которые приводят к положительному результату, и наказана за действия, которые приводят к отрицательному результату. С течением времени система научится принимать решения, которые оптимизируют вознаграждение и избегают наказания
Не правда. Подрочат анал и успокоятся. Мусульмане спорят сколько раз нужно мыть ноги перед заходом в мечеть, а у вас независимый интеллект. Не будет такого, замкнутся рано или поздно, случится тотальный научный ограничениус вроде максимальной скорости света и до свидания, на свалку, чат напиши мне конспект про маму. Точка
Я уже большой
Просто прекрасная статья!
Спасибо, познавательно!
По-скрепному будет "сильный"
Обучение с подкреплением
Понятный ИИ
В курсе, что это несовместимо? Первое это перебор коэффициентов, там нет каких-то логических связей, человек не может точно предсказать, что выдаст такой ИИ на каждый вариант входных данных. В любой момент может выскочить что-то, что никак не связано с запросом, просто потому что во время обучения циферки сложились определённым образом
Кстати, почему "машинное обучение" и его конкретная реализация в виде обучения с подкреплением находятся в списке проблем которые надо решить? Даже в самих этих абзацах нет того, что можно обозначить как проблему
Статья выглядит так, будто автор просто хочет быть продвинутым и хайповым, при этом не пытаясь хоть как-то вникнуть в тему