Как я делала расшифровку подкаста 🍍

Про необычный подход к написанию текста, оптимизацию процессов и новый опыт. Achtung! Это лонг и “текст о тексте” (так что на картинках тоже текст).

Как-то мы с Андреем Апанасиком сговорились поработать вместе над чем-нибудь интересным. И в качестве своеобразного “тестового задания” он предложил мне попробовать свои силы в расшифровках подкаста “Посиделки с инди”. У него как раз недоставало текста к последнему видео. Вот что получилось в итоге:

«Важно понять, что доставляет удовольствие и делать именно это»: главное со стрима с Алексеем Flazm Давыдовым

А теперь расскажу немного про процесс. Может мой опыт кому-то пригодится и сэкономит время в похожей ситуации.

1. С чего начала
2. Подходы к написанию расшифровок
3. Что я выбрала и почему
4. Сложности и особенности
5. Как шёл и трансформировался процесс
6. Недочёты и рецепт хорошей расшифровки
7. Идеи по оптимизации процесса
8. Заключение

Опыт оказался для меня совсем новым. Ближайшее, с чем могу сравнить — это написание конспектов в школе. Но только там записи делались для себя и кое-как, а не осмысленно и красивенько. Тут, само собой, такой подход не проканал бы. Что же я сделала? Правильно, — полезла в гугл. Стала смотреть, как люди пишут подобные тексты, как расшифровки делал сам Андрей (и какой фидбэк получал; порой весьма беспощадный), пыталась найти советы, готовые решения, инструкции.

Прочитывая очередной текст и сопоставляя его с первоисточником, я мысленно их сравнивала, анализировала изменения структуры повествования (если такая имела место), пыталась определить и систематизировать принципы, по которым строится текст на выходе (метазнание, метакогнитивный процесс). Процесс занимательный, отлично загружал голову и заставлял мозг работать по-новому (привычные шаблоны тут просто переставали работать), очень интересно. Думаю, у меня однозначно в итоге образовались новые нейронные связи, которым ещё найдётся применение :)

Главной целью поисков было найти то, что максимально упростит и ускорит выполнение задачи. Мне не очень повезло. Конкретных гайдлайнов я не нашла. У меня нет объяснения, почему так получилось. Возможно, плохо искала.

Я даже написала нашему редактору на работе. Советы, которые он мне дал, к тому моменту я уже знала, но об этом позже. Сейчас расскажу, какие подходы к вопросу мне удалось вычленить среди всего многообразия вариантов.

Это способы, на которые я наткнулась в своих поисках. Возможно, существуют и другие, на экспертность не претендую.

Конспект. Собственно, как в школе. Из всего слышимого вычленяем главное, сокращаем, записываем и получаем кашу, которую нужно потом перерабатывать в читабельный текст. Изначально я выбрала именно этот подход и в нём оформила примерно половину всего подкаста. Замучилась с доведением его до ума.

Интервью. Принцип простой: жирным текстом выделены имена спикеров, напротив — дословно их реплики (за исключением, конечно, всяких “эммм”, слов-паразитов и т.д.).

Плюсы: структура остаётся такой же, как в источнике.

Минусы: структура остаётся такой же, как в источнике. 😅

Поясню. Этот метод больше подходит, когда говорящие являются опытными ораторами (лекторы, дикторы, журналисты и т.д.) и их речь чётко структурирована. Это попросту неформат для “посиделок”, где беседа велась в более свободном, расслабленном ключе и была абсолютно нелинейной (даже при наличии изначальной структуры). Т.е. на одну тему спикеры могли говорить в разных частях видео с промежутком в полчаса-час.

Само по себе это, конечно, не минус, но на выходе хотелось получить не сухую транскрипцию, а что-то более живое и интересное и пофиг, что это усложняет задачу. К тому же наш текст включал в себя цитаты. Как читательница, считаю в подобных пересказах вставление прямых цитат <s>допрашиваемых</s> интервьюируемых хорошим тоном. Не то чтобы кто-то перевирал материал, но к цитате от первоисточника у меня всегда априори больше доверия.

Стенограмма. Пункт, близкий по сути к предыдущему. Это дословная запись. Иногда тут применяют стенографию, но я так не умею (и не собираюсь учиться; довольно специфический навык и нишевая фигня). Из явных примеров таких текстов — расшифровки стенограмм на сайтах правительства. Понятно, что такой подход уместен в конкретных случаях, например в суде и т.д. Отсюда почерпнуть полезных принципов не удалось, а сокращения в моём конспекте и так были.

Пересказ. Сабж. Это пересказ услышанного своими словами. Заставляет усерднее концентрироваться на сути высказывания, позволяет добавить в текст немного “себя”, что и как процесс выглядит более творчески, и на выходе создаёт более увлекательный материал. Для себя выбрала как оптимальный.

Speech-to-text. Самый ленивый и бесполезный метод. При помощи всевозможных тулз по распознаванию речи (как платных, так и бесплатных), которым скармливается исходник, можно получить текст. Качество его, конечно, оставляет желать лучшего. Сленг, имена собственные, специфическая терминология, нечёткая дикция, скомканная речь, англицизмы — всё, что может пойти не так, пойдёт не так.

YouTube позволяет сгенерировать субтитры автоматом и бесплатно, но толку от них нет, даже если убить ненужные пустые строки регулярками в нотпаде. Получается каша похлеще моего конспекта, абсолютно без пунктуации и разбивки по предложениям. Что делать с таким текстом я не знаю. Но в корзине смотрится как родной:

Короче, вариантов множество, а выбрать нужно было один.

Мой выбор в итоге пал на пересказ. Во-первых, предыдущие расшифровки написаны именно так, и во-вторых, — это довольно приятный, гибкий и удобоваримый формат, который оптимально подходит для творчества, держит в тонусе и вызывает живой интерес у всех вовлечённых. Процесс выглядит так:

терпеливо слушаем, пока спикер выскажется по вопросу;
передаём услышанное коротко и лаконично своими словами;
????
PROFIT!!!

Как ни крути, сплошные плюшки. Запись можно прослушать всего раз и вернуться только при острой необходимости. Не нужно перетряхивать свои конспекты и вспоминать неуказанные детали. И в принципе готовый текст пишется уверенными блоками сразу. Следующим этапом идёт его реструктурирование и позднее — редактура. Каеф.

С какими сложностями мне довелось столкнуться? Ооо, тут есть о чём рассказать.

Реструктурирование. Иногда к одной теме спикер возвращается многократно на протяжении всего видео. Эти куски при выбранном варианте написания текста нужно комбинировать вместе. Та ещё задачка. У тебя может быть два идеально переходящих друг в друга абзаца, а в конце ты понимаешь, что тебе нужно вставить ещё один аккурат между ними. И переписать все три :D Отсюда и разная структура в таймкодах и в итоговом тексте. Ещё дополнительная задача — новые подзаголовки.
“Вода”. Если видео длится 2+ часа, прочтение текста займёт от силы минут 20. Всё лишнее нужно отсеивать, чтобы оставить читателю самый смак.
Подбор цитат. На самом деле для меня не был такой уж трудностью. Как правило, такие фразы бросаются в глаза и звучат сами по себе как стейтмент, так что их легко различить и сразу соответствующе оформить в черновике.
Оформление. Сюда относятся видео и картинки, иллюстрирующие сказанное (например, трейлеры, скриншоты), мемы (если уместно), inline-ссылки, пояснения всяких штук, о которых читатель может не знать и прочие мелочи.
Восприятие информации на слух. Все люди по-разному воспринимают информацию. Условно нас всех можно поделить на аудиалов, визуалов и кинестетиков (люди, лучше воспринимающие и усваивающие информацию на слух, глазками или тактильно). Встречаются и смешанные типы. Я в первую очередь визуал. Я из тех, кто встречает по одёжке (и умеет оценить её по достоинству!). Хуже всего у меня с восприятием на слух: могу забыть услышанное прямо в процессе написания. Иностранные слова вообще учу строго по транскрипциям.
Ковид. Ещё одно личное обстоятельство. Мой больничный продлился 5 недель, и эта зараза сильно ударила по когнитивным способностям. Память ухудшилась, а восприятие прочитанного откатилось до уровня младшей школы (когда читаешь отдельные слова, и не можешь связать их в единую картину). Сейчас усердно работаю над восстановлением этих навыков, так как для меня они ключевые.

Как уже упоминалось, сперва я конспектировала услышанное, а потом “восстанавливала” текст абзац за абзацем. Так я обработала первые 15-20 минут и отправила Андрею на ревью.

Результат был неплох, но позднее я поняла, что этот подход не оптимален. Выглядит он так:

Слушаю и параллельно записываю ключевые слова и тезисы.
Перечитываю и пытаюсь вспомнить детали. Как оказалось, без них получается абсолютно пустой, мёртвый, сухой и скучный текст. Вспомнить все детали позднее, когда прослушано уже полчаса, крайне трудно. В моём случае всё ещё осложнялось ковидом и плохим восприятием информации на слух.

По факту я это вижу как двойную работу. Текст приходится писать (а иногда и слушать) дважды, если не больше. Т.к. время — мой самый ценный ресурс, разбазаривать его не хотелось. Поэтому в процессе я изменила подход и перешла на полный пересказ услышанного.

Я стала просто сидеть и слушать. Потом, когда спикер завершал свою мысль или заканчивалось обсуждение одного вопроса, я ставила паузу и писала в более или менее свободной форме пересказ услышанного. Получилось органичнее и интереснее. Если мне ещё доведётся работать с подобным материалом, я планирую использовать этот же подход.

Когда текст был готов, я отправила его Андрею вместе с комментариями в спорных местах. Затем текст несколько раз правился, редактировался и наконец обрёл свой финальный вид. В процессе редактуры материал так же обрастал картинками, скриншотами и видео.

Порефлексирую, что получилось не ок и почему так вышло.

(Честно, из-за ковида я забыла, что хотела здесь написать изначально))

Фидбэка от читателей не было совсем, а жаль! Тот случай, когда он действительно мог бы пойти на пользу.

Так на вскидку скажу, что реструктурирование текста для меня самая занудная часть, следовательно, результатом я недовольна, а следовательно — это недочёт. Не могу делать что-то через силу, но возможно “набью руку”, если буду дальше делать что-то в этом направлении.

Переходы между отдельными абзацами не всегда выглядят органично. Меня это беспокоит, но готового решения у меня нет. Может я ленюсь, может это ковид, maybe it’s Maybelline. Или придёт с опытом.

Когда моя расшифровка была готова, я наткнулась на отличный совет в одной полезной статье: писать текст только в одном времени. Страшно думать, сколько по неопытности я в этом плане могла совершить ошибок, но пометку на будущее в уме сделала.

Не могу назвать это недочётом, но просто неловким обстоятельством: в этот раз было много заминок в коммуникации, и в итоге процесс весьма затянулся. Если изначальный текст, с учётом всех сложностей и особенностей, был готов в течение недели, то до момента публикации прошло примерно ещё две, хотя спорных моментов как таковых было немного.

Что по моему скромному мнению характеризует хорошую расшифровку:

Живость. Это должен быть текст, который легко и интересно читать.
Внятная структура, как и у любого текста/лонгрида. Короткие удобоваримые абзацы, перемешанные с визуальным рядом.
Орфография, пунктуация. После 8+ лет вдали от родины я всё чаще начинаю писать с ошибками. И сейчас решилась на подписку LanguageTool, что очень выручает.
Безоценочность. Очевидно: не примешивать отсебятину, не приукрашать, не привирать, не высказывать свою позицию.
Фактчекинг (ситуативно). Пример: я искала когда именно вышел упомянутый бандл, чтобы вставить в статью скриншот.
Пояснения, ссылки. Читатели могут чего-то не знать и это нормально. Я могу помочь им, если оставлю небольшие пояснения (на примере моей расшифровки: упоминание о политике возвратов в Стим) или ссылки на более подробную информацию и какие-то источники.

Пока ещё не ясно, удастся ли мне сделать ещё расшифровки, но если бы такая возможность появилась, вот как бы я подошла к задаче, чтобы затрачивать меньше усилий для оптимального результата:

в этот раз я бы слушала стрим в реальном времени;
параллельно наговаривала бы свой пересказ на диктофон (пока что, из всех моих устройств, по качеству мне больше понравился тот, который на айпаде);
попробовала бы прогнать аудио через распознавалку речи. Если бы не проканало, просто писала бы потом под диктовку.
реструктурирование, картинки/скрины и т.д. Предпочтительнее и эффективнее было бы разделить этот и следующий этапы поровну + грамотнее выстроить коммуникацию.
редактура. Оптимизировать процесс внесения правок. Не писать очередной ответный комментарий, если правку можно внести самостоятельно без существенной потери смысла. Или, например, обсуждать сомнительные места на созвоне и сразу решать возникающие вопросы. Тогда не придётся бесконечно слать друг другу правки туда-сюда.

Что же может пойти не так?

Да всё что угодно )) В идеале в конце стрима можно получить готовую расшифровку, а распознавалка поймёт меня правильно и за ней не придётся много подчищать.

В худшем случае на первом этапе я буду часто делать паузы, потому что вероятнее всего диктовать придётся одновременно с продолжающими говорить спикерами. Возможно, с опытом такого станет меньше, но это лишь предположение (работают ведь как-то переводчики на заседаниях всяких 🤔). Осмелюсь сделать ещё одно: при стриме продолжительностью ~ 2 часа, скорее всего, у меня уйдёт 2,5—3 (и это в лучшем случае; помним про голимое восприятие информации на слух).

В последнее время я очень много пишу и всегда очень по-разному. Мне понравилось привнести что-то новое в этот занятный процесс. Ну и кооперативный подход к любой деятельности сам по себе занимателен. Тот случай, который можно описать клишированной банальщиной “одна голова хорошо, а две — лучше”.

Ещё раз спасибо Андрею за возможность!

Вот ещё раз ссылка на результат:

Ну и поздравьте именинника что ли, у него сегодня день рождения 🎉

#dfens_игрожор #игрожор #suvitruf_gamedev #посиделкисинди

48 комментариев

Andrei Apanasik

18.10.2022

500 ₽

Боже. Да тут только за оформление статьи можно премию давать!

Ответить

serguun42

22.10.2022

300 ₽

Отличный пост, ебейшее оформление, всё по делу. Лайк.

На правах донатера скажу, что у Google Pixel 7 с новым процессом Tensor 2 speech-to-text ещё лучше, чем у предшественника. Если шестой Пиксель просто чётко расставлял знаки препинания и просто хорошо слушал, то седьмой умеет «печатать» диалоги, разделяя говорящих(!) как в настоящем правильно оформленном тексте. 🤯

https://youtu.be/NE5H5intsck?t=310