Как я делала расшифровку подкаста 🍍
А теперь расскажу немного про процесс. Может мой опыт кому-то пригодится и сэкономит время в похожей ситуации.
Содержание
1. С чего начала
Опыт оказался для меня совсем новым. Ближайшее, с чем могу сравнить — это написание конспектов в школе. Но только там записи делались для себя и кое-как, а не осмысленно и красивенько. Тут, само собой, такой подход не проканал бы. Что же я сделала? Правильно, — полезла в гугл. Стала смотреть, как люди пишут подобные тексты, как расшифровки делал сам Андрей (и какой фидбэк получал; порой весьма беспощадный), пыталась найти советы, готовые решения, инструкции.
Прочитывая очередной текст и сопоставляя его с первоисточником, я мысленно их сравнивала, анализировала изменения структуры повествования (если такая имела место), пыталась определить и систематизировать принципы, по которым строится текст на выходе (метазнание, метакогнитивный процесс). Процесс занимательный, отлично загружал голову и заставлял мозг работать по-новому (привычные шаблоны тут просто переставали работать), очень интересно. Думаю, у меня однозначно в итоге образовались новые нейронные связи, которым ещё найдётся применение :)
Главной целью поисков было найти то, что максимально упростит и ускорит выполнение задачи. Мне не очень повезло. Конкретных гайдлайнов я не нашла. У меня нет объяснения, почему так получилось. Возможно, плохо искала.
Я даже написала нашему редактору на работе. Советы, которые он мне дал, к тому моменту я уже знала, но об этом позже. Сейчас расскажу, какие подходы к вопросу мне удалось вычленить среди всего многообразия вариантов.
2. Подходы к написанию расшифровок
Это способы, на которые я наткнулась в своих поисках. Возможно, существуют и другие, на экспертность не претендую.
Конспект. Собственно, как в школе. Из всего слышимого вычленяем главное, сокращаем, записываем и получаем кашу, которую нужно потом перерабатывать в читабельный текст. Изначально я выбрала именно этот подход и в нём оформила примерно половину всего подкаста. Замучилась с доведением его до ума.
Интервью. Принцип простой: жирным текстом выделены имена спикеров, напротив — дословно их реплики (за исключением, конечно, всяких “эммм”, слов-паразитов и т.д.).
Плюсы: структура остаётся такой же, как в источнике.
Минусы: структура остаётся такой же, как в источнике. 😅
Поясню. Этот метод больше подходит, когда говорящие являются опытными ораторами (лекторы, дикторы, журналисты и т.д.) и их речь чётко структурирована. Это попросту неформат для “посиделок”, где беседа велась в более свободном, расслабленном ключе и была абсолютно нелинейной (даже при наличии изначальной структуры). Т.е. на одну тему спикеры могли говорить в разных частях видео с промежутком в полчаса-час.
Само по себе это, конечно, не минус, но на выходе хотелось получить не сухую транскрипцию, а что-то более живое и интересное и пофиг, что это усложняет задачу. К тому же наш текст включал в себя цитаты. Как читательница, считаю в подобных пересказах вставление прямых цитат <s>допрашиваемых</s> интервьюируемых хорошим тоном. Не то чтобы кто-то перевирал материал, но к цитате от первоисточника у меня всегда априори больше доверия.
Стенограмма. Пункт, близкий по сути к предыдущему. Это дословная запись. Иногда тут применяют стенографию, но я так не умею (и не собираюсь учиться; довольно специфический навык и нишевая фигня). Из явных примеров таких текстов — расшифровки стенограмм на сайтах правительства. Понятно, что такой подход уместен в конкретных случаях, например в суде и т.д. Отсюда почерпнуть полезных принципов не удалось, а сокращения в моём конспекте и так были.
Пересказ. Сабж. Это пересказ услышанного своими словами. Заставляет усерднее концентрироваться на сути высказывания, позволяет добавить в текст немного “себя”, что и как процесс выглядит более творчески, и на выходе создаёт более увлекательный материал. Для себя выбрала как оптимальный.
Speech-to-text. Самый ленивый и бесполезный метод. При помощи всевозможных тулз по распознаванию речи (как платных, так и бесплатных), которым скармливается исходник, можно получить текст. Качество его, конечно, оставляет желать лучшего. Сленг, имена собственные, специфическая терминология, нечёткая дикция, скомканная речь, англицизмы — всё, что может пойти не так, пойдёт не так.
YouTube позволяет сгенерировать субтитры автоматом и бесплатно, но толку от них нет, даже если убить ненужные пустые строки регулярками в нотпаде. Получается каша похлеще моего конспекта, абсолютно без пунктуации и разбивки по предложениям. Что делать с таким текстом я не знаю. Но в корзине смотрится как родной:
Короче, вариантов множество, а выбрать нужно было один.
3. Что я выбрала и почему
Мой выбор в итоге пал на пересказ. Во-первых, предыдущие расшифровки написаны именно так, и во-вторых, — это довольно приятный, гибкий и удобоваримый формат, который оптимально подходит для творчества, держит в тонусе и вызывает живой интерес у всех вовлечённых. Процесс выглядит так:
- терпеливо слушаем, пока спикер выскажется по вопросу;
- передаём услышанное коротко и лаконично своими словами;
- ????
- PROFIT!!!
Как ни крути, сплошные плюшки. Запись можно прослушать всего раз и вернуться только при острой необходимости. Не нужно перетряхивать свои конспекты и вспоминать неуказанные детали. И в принципе готовый текст пишется уверенными блоками сразу. Следующим этапом идёт его реструктурирование и позднее — редактура. Каеф.
4. Сложности и особенности
С какими сложностями мне довелось столкнуться? Ооо, тут есть о чём рассказать.
- Реструктурирование. Иногда к одной теме спикер возвращается многократно на протяжении всего видео. Эти куски при выбранном варианте написания текста нужно комбинировать вместе. Та ещё задачка. У тебя может быть два идеально переходящих друг в друга абзаца, а в конце ты понимаешь, что тебе нужно вставить ещё один аккурат между ними. И переписать все три :D Отсюда и разная структура в таймкодах и в итоговом тексте. Ещё дополнительная задача — новые подзаголовки.
- “Вода”. Если видео длится 2+ часа, прочтение текста займёт от силы минут 20. Всё лишнее нужно отсеивать, чтобы оставить читателю самый смак.
- Подбор цитат. На самом деле для меня не был такой уж трудностью. Как правило, такие фразы бросаются в глаза и звучат сами по себе как стейтмент, так что их легко различить и сразу соответствующе оформить в черновике.
- Оформление. Сюда относятся видео и картинки, иллюстрирующие сказанное (например, трейлеры, скриншоты), мемы (если уместно), inline-ссылки, пояснения всяких штук, о которых читатель может не знать и прочие мелочи.
- Восприятие информации на слух. Все люди по-разному воспринимают информацию. Условно нас всех можно поделить на аудиалов, визуалов и кинестетиков (люди, лучше воспринимающие и усваивающие информацию на слух, глазками или тактильно). Встречаются и смешанные типы. Я в первую очередь визуал. Я из тех, кто встречает по одёжке (и умеет оценить её по достоинству!). Хуже всего у меня с восприятием на слух: могу забыть услышанное прямо в процессе написания. Иностранные слова вообще учу строго по транскрипциям.
- Ковид. Ещё одно личное обстоятельство. Мой больничный продлился 5 недель, и эта зараза сильно ударила по когнитивным способностям. Память ухудшилась, а восприятие прочитанного откатилось до уровня младшей школы (когда читаешь отдельные слова, и не можешь связать их в единую картину). Сейчас усердно работаю над восстановлением этих навыков, так как для меня они ключевые.
5. Как шёл и трансформировался процесс
Как уже упоминалось, сперва я конспектировала услышанное, а потом “восстанавливала” текст абзац за абзацем. Так я обработала первые 15-20 минут и отправила Андрею на ревью.
Результат был неплох, но позднее я поняла, что этот подход не оптимален. Выглядит он так:
- Слушаю и параллельно записываю ключевые слова и тезисы.
- Перечитываю и пытаюсь вспомнить детали. Как оказалось, без них получается абсолютно пустой, мёртвый, сухой и скучный текст. Вспомнить все детали позднее, когда прослушано уже полчаса, крайне трудно. В моём случае всё ещё осложнялось ковидом и плохим восприятием информации на слух.
По факту я это вижу как двойную работу. Текст приходится писать (а иногда и слушать) дважды, если не больше. Т.к. время — мой самый ценный ресурс, разбазаривать его не хотелось. Поэтому в процессе я изменила подход и перешла на полный пересказ услышанного.
Я стала просто сидеть и слушать. Потом, когда спикер завершал свою мысль или заканчивалось обсуждение одного вопроса, я ставила паузу и писала в более или менее свободной форме пересказ услышанного. Получилось органичнее и интереснее. Если мне ещё доведётся работать с подобным материалом, я планирую использовать этот же подход.
Когда текст был готов, я отправила его Андрею вместе с комментариями в спорных местах. Затем текст несколько раз правился, редактировался и наконец обрёл свой финальный вид. В процессе редактуры материал так же обрастал картинками, скриншотами и видео.
6. Недочёты и рецепт хорошей расшифровки
Порефлексирую, что получилось не ок и почему так вышло.
(Честно, из-за ковида я забыла, что хотела здесь написать изначально))
Фидбэка от читателей не было совсем, а жаль! Тот случай, когда он действительно мог бы пойти на пользу.
Так на вскидку скажу, что реструктурирование текста для меня самая занудная часть, следовательно, результатом я недовольна, а следовательно — это недочёт. Не могу делать что-то через силу, но возможно “набью руку”, если буду дальше делать что-то в этом направлении.
Переходы между отдельными абзацами не всегда выглядят органично. Меня это беспокоит, но готового решения у меня нет. Может я ленюсь, может это ковид, maybe it’s Maybelline. Или придёт с опытом.
Когда моя расшифровка была готова, я наткнулась на отличный совет в одной полезной статье: писать текст только в одном времени. Страшно думать, сколько по неопытности я в этом плане могла совершить ошибок, но пометку на будущее в уме сделала.
Не могу назвать это недочётом, но просто неловким обстоятельством: в этот раз было много заминок в коммуникации, и в итоге процесс весьма затянулся. Если изначальный текст, с учётом всех сложностей и особенностей, был готов в течение недели, то до момента публикации прошло примерно ещё две, хотя спорных моментов как таковых было немного.
Что по моему скромному мнению характеризует хорошую расшифровку:
- Живость. Это должен быть текст, который легко и интересно читать.
- Внятная структура, как и у любого текста/лонгрида. Короткие удобоваримые абзацы, перемешанные с визуальным рядом.
- Орфография, пунктуация. После 8+ лет вдали от родины я всё чаще начинаю писать с ошибками. И сейчас решилась на подписку LanguageTool, что очень выручает.
- Безоценочность. Очевидно: не примешивать отсебятину, не приукрашать, не привирать, не высказывать свою позицию.
- Фактчекинг (ситуативно). Пример: я искала когда именно вышел упомянутый бандл, чтобы вставить в статью скриншот.
- Пояснения, ссылки. Читатели могут чего-то не знать и это нормально. Я могу помочь им, если оставлю небольшие пояснения (на примере моей расшифровки: упоминание о политике возвратов в Стим) или ссылки на более подробную информацию и какие-то источники.
7. Идеи по оптимизации процесса
Пока ещё не ясно, удастся ли мне сделать ещё расшифровки, но если бы такая возможность появилась, вот как бы я подошла к задаче, чтобы затрачивать меньше усилий для оптимального результата:
- в этот раз я бы слушала стрим в реальном времени;
- параллельно наговаривала бы свой пересказ на диктофон (пока что, из всех моих устройств, по качеству мне больше понравился тот, который на айпаде);
- попробовала бы прогнать аудио через распознавалку речи. Если бы не проканало, просто писала бы потом под диктовку.
- реструктурирование, картинки/скрины и т.д. Предпочтительнее и эффективнее было бы разделить этот и следующий этапы поровну + грамотнее выстроить коммуникацию.
- редактура. Оптимизировать процесс внесения правок. Не писать очередной ответный комментарий, если правку можно внести самостоятельно без существенной потери смысла. Или, например, обсуждать сомнительные места на созвоне и сразу решать возникающие вопросы. Тогда не придётся бесконечно слать друг другу правки туда-сюда.
Что же может пойти не так?
Да всё что угодно )) В идеале в конце стрима можно получить готовую расшифровку, а распознавалка поймёт меня правильно и за ней не придётся много подчищать.
В худшем случае на первом этапе я буду часто делать паузы, потому что вероятнее всего диктовать придётся одновременно с продолжающими говорить спикерами. Возможно, с опытом такого станет меньше, но это лишь предположение (работают ведь как-то переводчики на заседаниях всяких 🤔). Осмелюсь сделать ещё одно: при стриме продолжительностью ~ 2 часа, скорее всего, у меня уйдёт 2,5—3 (и это в лучшем случае; помним про голимое восприятие информации на слух).
8. Заключение
В последнее время я очень много пишу и всегда очень по-разному. Мне понравилось привнести что-то новое в этот занятный процесс. Ну и кооперативный подход к любой деятельности сам по себе занимателен. Тот случай, который можно описать клишированной банальщиной “одна голова хорошо, а две — лучше”.
Ещё раз спасибо Андрею за возможность!
Вот ещё раз ссылка на результат:
Ну и поздравьте именинника что ли, у него сегодня день рождения 🎉
Боже. Да тут только за оформление статьи можно премию давать!
Отличный пост, ебейшее оформление, всё по делу. Лайк.
На правах донатера скажу, что у Google Pixel 7 с новым процессом Tensor 2 speech-to-text ещё лучше, чем у предшественника. Если шестой Пиксель просто чётко расставлял знаки препинания и просто хорошо слушал, то седьмой умеет «печатать» диалоги, разделяя говорящих(!) как в настоящем правильно оформленном тексте. 🤯
https://youtu.be/NE5H5intsck?t=310
Комментарий недоступен
Комментарий недоступен