Рекордер - найкращий винахід з часів вікна пошуку Google

Google Pixel 4 отримав непогані огляди, але більшість, в тому числі і моя, принаймні зробили паузу, щоб дізнатися одну вражаючу частину алгоритмічної алхімії: Recorder.

Цей мобільний додаток для транскрипції в реальному часі не схожий на жоден, який я намагався використовувати раніше. Це неймовірно швидко, приголомшливо точно і вже змінило мою роботу.


Отримувати слова

Зараз, ближче до початку мого п'ятого десятиліття звітності, я можу згадати всі різні способи, якими я намагався полегшити тягар запису нотаток в реальному часі і транскрипції. Як репортер у полі, я пам'ятаю, як люто писала на блокноті, молилася, щоб моя ручка не видавалася, а пальці не зціпляли - обидва траплялися випадково. Навіть коли вони цього не робили, мій почерк часто виглядав як погано вигравіруваний ієрогліф. Це була англійська, але тільки в тому сенсі, в якому McDonald's можна вважати кухнею.

Пізніше я почав використовувати цифровий рекордер Olympus для високоякісних запитань і відповідей, а потім боявся повільного і втомливого процесу фактичного запису інтерв'ю.

Найсмішніше, що я завжди робив записи одночасно з записом, і, якщо я дійсно грав у свою гру, я іноді записував мітки часу поруч з певними частинами, щоб я міг повернутися і прослухати запис, щоб перевірити цитату, Це стало трохи легше з моїм iPhone і додатками, такими як iTalk, але було також понуро дізнатися, як часто я думав, що чую щось один, тільки щоб дізнатися, слухаючи аудіо, що це було сказано по-іншому. Я не кажу, що те, що я записав, не відображало суть цитати - вона також незмінно робила - але точне формулювання зазвичай складалося з одного або двох слів.

Ось чому журналісти зазвичай перефразовують. Важко знайти точні цитати з рукописних нотаток, і розшифровка кожного інтерв'ю займає неймовірно багато часу.

Чесно кажучи, я боюся інтерв'ю саме з цієї причини. Однак є випадки, коли записи розкрили свіжу інформацію (наприклад, коли мені довелося записати імпровізовану прес-конференцію Джеффа Безоса на відео), або, у випадку з розповідями про споживчі технології, розкрили ключові технічні деталі, які я б інакше пропустив.

Новий інструмент

Коли я вперше переглянув Pixel 4 від Google, у мене було зовсім небагато часу, щоб спробувати Recorder і, можливо, несправедливо, заперечувати його як дещо неточну утиліту, якої можна знехтувати. Тепер, однак, я бачу це по-іншому.


Під час одного недавнього прес-брифінгу я ненадійно врівноважив Pixel 4 на нозі, включив рекордер, вибрав «Транскрипція», а потім переключив свою увагу на зйомку деяких фотографій за допомогою моєї дзеркальної фотокамери. Тим часом ведучий говорив так, ніби брав участь у змаганнях зі швидкого спілкування (він навіть зробив паузу на вдих?). Я глянув на телефон Pixel 4 і побачив, що слова, які він вимовляв, вилилися на екран майже так само, як він їх вимовляв. Він навіть підбирав розриви абзаців. Між цими перервами були мітки часу, які знадобилися б пізніше.

На моєму наступному прес-брифінгу я помістив Pixel 4 на маленький столик переді мною і дозволив Recorder виконати свою роботу.

Чи потрібно це прибирати, а деякі взад і вперед перевіряти, що він дійсно мав на увазі: «У Коллі були всі відповіді», а не «У Поллі було більше відповідей»? Звичайно.

В обох випадках якість транскрипції була вище всього, що я коли-небудь бачив. Були деякі помилки, слово або два тут і там, які явно помилилися, знак пропущеної пунктуації, але там, де він не вдався, я міг вибрати найближчу мітку часу і відтворити звук, щоб слова були правильними.

Ще краще, замість того, щоб зберігати транскрипцію в якомусь езотеричному форматі файлу, я міг би відправити її собі у вигляді простого тексту.

Рекордер для Більше

Незважаючи на те, що я можу відправити собі стенограму, Google підтримує глибокий і важливий зв'язок між аудіо і транскрипціями. Якщо у мене є смутний спогад про те, що одне з моїх джерел використовувало певну фразу або слово, але не може згадати, коли під час нашої 20-хвилинної розмови він виголосив це, я можу знайти ключове слово, і реєстратор виділить точне місце розташування або місця розташування цієї фрази. Я витратив роки, використовуючи iTalk для запису інтерв'ю, але без моїх власних копітких транскрипцій я б ніколи не став шукати свої записи таким чином.

Рекордер тим більше вражає, тому що Google не використовує свій великий хмарний графік знань для допомоги AI. Замість цього вся обробка, розпізнавання тексту і контексту відбувається на апаратному і програмному забезпеченні Pixel 4.


Ну і що

Коли я відступаю на хвилину і вперше думаю про те, що може зробити Рекордер (і так, я пробував інші транскрібери, і жоден з них не був таким швидким і точним), я розумію, що це здатне змінити все - від відвідування лікаря і психіатра до поліцейські звіти і записи в залі суду.

Очевидно, що повинна бути деяка прозорість - «Ей, я збираюся записати вас, добре?» - але точність, яка обов'язково покращиться протягом наступних декількох років, може стати настільки хорошою, що ці записи і транскрипції стати офіційним рекордом. І уявіть, що це означатиме для науки, де дослідникам доводиться переливати записи в пошуках важливих сигналів. Записи транскрипції і пошук дозволять дослідникам швидко отримати доступ до згадок про конкретні почуття, результати, потреби або взаємодії між результатами сотень суб'єктів.

Для письменників Recorder може стати одкровенням. Я уявляю, як автор Джеймс Паттерсон ходить по підлозі - його Pixel 4 сидить на сусідньому журнальному столику - розкручує свій останній трилер, а потім голосом говорить помічнику Google відправити його редактору. Чи потрібно це прибирати, а деякі взад-вперед перевіряти, що він дійсно мав на увазі: «У Коллі були всі відповіді», а не «У Поллі було більше відповідей»? Звичайно. Але як людина, яка пише для життя, я знаю, що мої пальці часто не набирають так швидко або майже так точно, як я можу думати і говорити. Це може бути перша транскрипційна програма, якій я довіряю свою дорогоцінну прозу.

На жаль, тут є великий стримуючий фактор. Рекордер працює тільки на Pixel 4 і, швидше, на старих телефонах Pixel. Наскільки нам відомо, не планується пропонувати додаток Recorder на інших пристроях Android або платформах.

Якби я працював в Google, я б взяв Recorder і обернув навколо нього тонкий апарат (так, для перенесення даних запису йому знадобився б сенсорний екран і, принаймні, WIFI), і продав би його як новий вид цифрового диктофона. Ціна на $59,99, і він буде продаватися як божевільний. Першими покупцями будуть журналісти, другі, можливо, лікарі. Б'юся об заклад, придворним стенографам це сподобається. Після цього? Хто знає?


Сподобався цей стовпчик? Отримайте більше як це доставлено прямо на вашу поштову скриньку.
Підпишіться на Untangled, більш розумний підхід до технологій.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND