Быстрые API: как gRPC и Protobuf решают ограничения HTTP/1.1

Введение
HTTP/1.1: устройство протокола и проблемы
HOL-блокировка
HTTP/2: мультиплексирование и устранение блокировки
RPC-подход и появление gRPC
Типы RPC-взаимодействия в gRPC
Практический пример: gRPC в приложении Spring Boot
Когда HTTP/1.1 (REST) все еще предпочтителен, а где стоит применять gRPC
Заключение

Введение

HTTP/1.1 долгие годы оставался основой веб-взаимодействия, позволяя клиентам и серверам обмениваться текстовыми сообщениями (например, в формате JSON) по протоколу HTTP поверх TCP. Однако со временем выявились ключевые ограничения HTTP/1.1 – в частности, отсутствие эффективного мультиплексирования запросов и проблема HOL (Head-of-Line Blocking). Эти недостатки негативно сказываются на производительности и задержках при передаче данных.

В ответ на ограничения HTTP/1.1 появились новые подходы и технологии. Сначала был стандартизован HTTP/2.0, решивший ряд проблем за счет мультиплексирования, сжатия заголовков и других усовершенствований. Поверх HTTP/2 компания Google разработала высокопроизводительный фреймворк удаленного вызова процедур – gRPC, использующий бинарный протокол Protocol Buffers (Protobuf) для сериализации данных. gRPC изначально создавался для межсервисного взаимодействия в распределенных системах и стал популярным благодаря поддержке стриминговых двунаправленных соединений, строгой типизации данных и автогенерации кода для разных языков.

Цель этой статьи – провести детальный разбор HTTP/1.1 и gRPC (на базе HTTP/2) с точки зрения бэкенд-разработчика. Мы рассмотрим:

Устройство и недостатки HTTP/1.1: проблемы последовательной обработки запросов, попытки их решения (постоянные соединения, конвейеризация запросов) и почему возникают задержки из-за HOL-блокировки.
Преимущества HTTP/2 и как gRPC использует их для эффективного коммуникационного протокола.
Что такое gRPC и Protobuf: какие проблемы они решают по сравнению с традиционным REST/HTTP, и какие побочные эффекты и сложности возникают при их использовании.
Все четыре модели взаимодействия в gRPC:
- unary (одиночный запрос-ответ),
- server streaming (серверный стриминг),
- client streaming (клиентский стриминг)
- bidirectional streaming (двунаправленный стриминг),
- с практическими примерами их реализации.
Практический пример интеграции gRPC в Spring Boot (Java 24, Spring Boot 3.5+): как определить сервис в .proto-файле, сгенерировать код и использовать его на сервере и клиенте, включая фрагменты кода и схемы взаимодействия.
Сравнение и рекомендации: в каких случаях традиционный HTTP/1.1 (REST) все еще предпочтителен, почему не произошло полного перехода всех систем на gRPC, и когда имеет смысл использовать каждый из подходов.

Аудитория статьи – бэкенд-разработчики уровня junior+ и выше. Мы постараемся детально осветить тему, снабдив объяснения иллюстрациями и диаграммами (sequence diagram и C4 Container) с использованием нотации PlantUML. Это позволит получить целостное понимание проблем и решений, а также увидеть наглядные примеры архитектуры и последовательности обмена сообщениями.

HTTP/1.1: устройство протокола и проблемы

HTTP/1.1 – текстовый протокол приложений, работающий поверх TCP. С момента стандартизации HTTP/1.1 (в конце 1990-х) он внес ряд улучшений по сравнению с HTTP/1.0, включая использование постоянных (keep-alive) соединений по умолчанию, поддержку чанкования (потоковой передачи тела ответа) и другие возможности. HTTP/1.1 стал базой для архитектурного стиля REST и сегодня лежит в основе большинства веб-API. Он обладает важными свойствами: простота, человеческая читаемость сообщений (HTTP-заголовки и тело часто в формате JSON/XML), понятная модель запросов (методы GET, POST и т.д.) и масштабируемость за счет stateless-архитектуры (каждый запрос обрабатывается независимо, не требуя сохранения состояния на сервере). Эти качества сделали HTTP/1.1 чрезвычайно популярным, породив обширную экосистему инструментов, библиотек и практик разработки.

Однако архитектурные ограничения HTTP/1.1 стали узким местом по мере роста требований к производительности веб-приложений. Главная проблема – последовательная обработка запросов по одному соединению и вытекающая из этого HoL-блокировка. Рассмотрим подробнее эти аспекты:

Последовательность запросов на одном соединении: HTTP/1.1 допускает отправку нескольких запросов по одному TCP-соединению (persistent connection), но не поддерживает одновременную обработку – новые запросы можно отправлять только после получения ответа на предыдущий. То есть, внутри одного соединения запросы и ответы строго упорядочены: клиент отправил Request 1 -> получил Response 1 -> затем может отправить Request 2 и т.д. Такая модель упрощает реализацию (нет необходимости маркировать запросы идентификаторами), но приводит к простою: если один запрос обрабатывается долго, последующие ждут завершения первого. В веб-приложениях браузер обходил это ограничение, устанавливая несколько параллельных TCP-соединений (обычно 4-8) к каждому домену, чтобы загружать ресурсы (CSS, JS, изображения) одновременно. Но число соединений тоже ограничено, а каждое соединение – это накладные расходы на установку TCP и расход трафика на заголовки.
Конвейеризация (HTTP pipelining): В спецификации HTTP/1.1 предложена опциональная возможность – Pipeline (конвейер запросов). Она позволяла клиенту отправлять несколько запросов подряд, не дожидаясь ответов, с условием что ответы все равно придут строго в порядке запросов. Идея – лучше использовать время простоя соединения. Однако на практике pipelining почти нигде не включался, из-за проблем с прокси и главного недостатка: если один из запросов обрабатывается медленно, ответы на последующие (даже если они уже готовы) задерживаются, так как должны идти в порядке. Это и есть проявление Head-of-Line Blocking на уровне приложения – блокировка всей очереди из-за первой задержавшейся операции. В случае HTTP/1.1 pipelining, если первый запрос в пачке затормозил (например, долгая операция на сервере или потеря пакета), то последующие ответы будут удерживаться, даже если сами были быстрыми. В итоге производительность конвейера не оправдала ожиданий, и браузеры отключили pipelining по умолчанию. Таким образом, практически единственным способом параллелизации при HTTP/1.1 оставалось открывать несколько TCP-соединений и распределять запросы между ними.
Head-of-Line Blocking на уровне TCP: Даже без конвейеризации, проблема HoL-блокировки проявляется при последовательной модели: если первый запрос в соединении задержался, все последующие ждут. Например, клиент запрашивает по одному соединению HTML страницы, затем CSS, затем JS. Пока сервер не отправит полностью HTML, запросы CSS/JS не могут быть даже начаты по тому же соединению. Если HTML генерируется долго, статические файлы задерживаются, увеличивая общее время загрузки страницы. Аналогично на сервере: ограничение порядковой отправки ответов вынуждает “тормозить” быстрые ответы вслед за медленными.

Эти особенности ведут к ряду практических проблем:

Увеличение латентности при множественных запросах: Современная веб-страница требует загрузки десятков ресурсов. HTTP/1.1 вынужден либо загружать их последовательно на одном соединении, либо бить на несколько параллельных соединений, которые тоже не бесконечны. В любом случае, суммарная задержка растет из-за чередования сетевой задержки и блокировок. Это стимулировало веб-разработчиков идти на ухищрения: шардировать ресурсы по разным доменам (чтобы обойти лимит соединений браузера), объединять файлы (CSS/JS бандлы) и пр. – лишь бы уменьшить количество последовательных запросов.
Неэффективность использования одного соединения: TCP-соединение способно передавать данные постоянно, но HTTP/1.1 с последовательными запросами часто простаивает: пока сервер думает над ответом, соединение не передает другие данные, хотя мог бы. Пропускная способность канала используется не полностью.
HOL-блокировка усиливается на потерях пакетов: Если на уровне TCP потерялся сегмент, TCP протокол приостанавливает доставку следующих данных до получения повторного пакета – это HOL-блокировка на транспорте. В HTTP/1.1 каждый запрос последовательно зависит от предыдущего, так что потеря пакета для одного ответа блокирует вообще все последующие ответы по соединению. Таким образом, на ненадежных сетях (с высокими потерями, мобильный интернет) HTTP/1.1 особенно медлителен.

В итоге, к началу 2010-х стало ясно, что для удовлетворения возросших потребностей нужны изменения в протоколе. Были инициированы разработки, вылившиеся в стандарт HTTP/2.0 (2015). Прежде чем перейти к gRPC, разберем, какие улучшения принес HTTP/2 и почему они важны.

HOL-блокировка

Head-of-Line (HoL)-блокировка – это ситуация, когда первый (“головной”) элемент в очереди задерживается и заставляет ждать все остальные за ним, даже если они уже готовы к обработке/доставке. В сетях это проявляется на разных слоях:

На уровне приложения (HTTP/1.1): ответы обязаны приходить строго по порядку запросов в одном соединении. Один “медленный” ответ удерживает “быстрые”.
На уровне транспорта (TCP): поток байтов упорядочен. Если потерян сегмент, получатель не покажет следующие данные, пока недостающий кусок не приедет – тем самым все последующие данные в этом соединении “подвисают”.
На уровне канала (коммутаторы/очереди): переполненная/задержанная очередь на одном потоке может тормозить кадры для других потоков, если они делят общий буфер/очередь.

Далее – ключевые моменты, которые чаще всего важны бэкендеру.

HOL в HTTP/1.1 (уровень приложения)

В одном TCP-соединении HTTP/1.1 обрабатывает запросы последовательно: Req1 -> Resp1 -> Req2 -> Resp2 -> …. Даже если клиент применяет pipelining (послать несколько запросов сразу), сервер обязан отдать ответы в том же порядке. Если Resp1 “тяжелый” (медленный рендер/БД/таймаут внешнего API), то Resp2, Resp3, … вынуждены ждать, хотя готовы раньше.

Мини-пример (HTTP/1.1, одно соединение)

Рис. 1: HOL блокировка при одном соединении.

Следствия:

“Хвост” запросов накапливается за “головой”.
Итоговое TTV/TTFB для легких запросов растет без своей вины.
Браузеры исторически открывали несколько TCP-соединений на хост (4–8), чтобы частично обойти HOL.

HOL в TCP (уровень транспорта)

TCP – упорядоченный поток байтов: если пакет потерялся, получатель не может передать приложению следующие данные, пока ретрансмит не восстановит порядок. На одном TCP-соединении это бьет сразу по всем параллельным логическим потокам, которые поверх него едут.

HTTP/2 и остаточный HOL

HTTP/2 устраняет HOL на уровне HTTP (фреймы разных потоков мультиплексируются), но все еще едет по одному TCP-соединению. Если теряется TCP-сегмент, все HTTP/2-потоки, разделяющие это соединение, ждут ретрансмит. Поэтому при нестабильной сети остаточный HOL сохраняется.

HTTP/3 (QUIC) и устранение HOL на транспорте

HTTP/3 поверх QUIC (UDP) дает независимые стримы на транспортном уровне. Потеря в одном стриме не стопорит другие – HOL на транспорте ликвидируется. Это важно для высоколатентных/шумных сетей (мобайл, Wi-Fi).

Виды HOL на практике – “карточки”

HTTP/1.1 (одно соединение): HOL на приложении да; на транспорте да.
HTTP/1.1 (несколько соединений): уменьшаем эффект, но платим за коннекты и конкуренцию за сеть.
HTTP/2 (одно соединение): HOL на приложении нет (мультиплексирование), на транспорте да (TCP).
gRPC поверх HTTP/2: те же свойства HTTP/2 + бинарная сериализация; HOL трансп. уровня возможен.
HTTP/3/QUIC: HOL на приложении нет; на транспорте нет (независимые стримы).

Симптомы и как диагностировать

Симптомы:

“Легкие” запросы становятся “тяжелыми”, если рядом есть один “медленный”.
Высокая дисперсия TTFB/латентности без CPU- причины.
Плато пропускной способности при росте конкурентности на одном соединении.

Как проверять:

Сбор таймингов на клиенте: TTFB, download, корреляция “соседних” запросов в одном соединении.
Серверные метрики: очередь на воркерах/конвейерах, время до первого байта.
Трассировка: отметьте порядок начала/окончания обработок vs порядок фактической доставки клиенту.
Сниффер/pcap: ретрансмит TCP и паузы ровно в моменты всплесков задержек по всем запросам в соединении.

Инженерные стратегии смягчения HOL

Для HTTP/1.1

Несколько соединений на клиента: браузерный паттерн (ограничено, но помогает).
Разделение тяжелых и легких на разные домены/пулы соединений.
Асинхронные/потоковые ответы (chunked), где уместно, – сокращают TTFB длинных ответов, но порядок все равно линейный.

Для HTTP/2/gRPC (TCP)

Ограничивать “тяжелые” RPC (батчи, тайм-ауты, дедлайны, circuit-breaker), чтобы не забивать окно коннекта.
Шардирование потоков по нескольким HTTP/2-соединениям (например, по типам трафика), если сеть шумная.
QoS/приоритизация потоков HTTP/2 (ограниченно поддерживается, помогает не всегда).
Снижение потерь: правильные MTU/MSS, BBR/CUBIC тюнинг, качество канала.

Переход на HTTP/3/QUIC (когда возможно)

Для сценариев, где потери/джиттер неминуемы (мобайл), QUIC реально уменьшает хвосты задержек.

Рис. 2: сравнение HTTP/1.1 vs HTTP/2 при “медленном” первом ответе

HTTP/2: мультиплексирование и устранение блокировки

HTTP/2.0 – основное усовершенствование протокола HTTP за последние десятилетия, решающее проблемы HTTP/1.x на уровне приложения. Важнейшее изменение – мультиплексирование запросов и ответов поверх одного TCP-соединения. HTTP/2 переводит протокол в бинарный формат и вводит понятие потоков (streams), позволяя отправлять несколько HTTP-запросов параллельно по одному соединению, при этом ответы могут приходить в перемешанном порядке. Это достигается разбиением сообщений на фреймы небольшого размера и их чередованием в потоке байтов. Каждый фрейм помечается идентификатором потока, что позволяет получателю собрать фреймы по соответствующим запросам.

Как мультиплексирование решает проблему HOL-блокировок на уровне приложения? Теперь медленный ответ не блокирует остальные: сервер может начать отдавать ответ на второй и третий запрос, даже если первый еще не готов, просто чередуя фреймы разных потоков. Браузер, отправив 6 запросов за ресурсами, получает данные по всем постепенно, по мере готовности, а не строго один за другим. Это резко ускоряет загрузку страниц – быстрые ресурсы приходят без ожидания медленных. Исследования показывают драматическое улучшение времени загрузки за счет мультиплексирования HTTP/2.

Помимо мультиплексирования, HTTP/2 привнес: сжатие заголовков (HPACK) для экономии трафика на повторяющихся header’ах, приоритеты потоков (client может подсказать, что важнее), server push – возможность серверу отправлять данные заблаговременно. Но в контексте нашей темы главное – устранение блокировки очереди на уровне HTTP.

Важно отметить, что HTTP/2 сохранил семантику HTTP. Для приложения верхнего уровня отличие почти не заметно: те же методы, коды ответа, заголовки – просто “под капотом” они упакованы по-новому и могут идти параллельно. Благодаря этому переход на HTTP/2 возможен без переписывания приложений – достаточно, чтобы клиент и сервер поддерживали новый протокол (обычно с TLS/ALPN).

Конечно, HOL-блокировка не исчезла полностью – она спустилась ниже, на транспортный уровень (TCP). Если все взаимодействие идет по одному TCP-соединению, то потеря пакета задержит доставку данных во всех потоках сразу, т.к. TCP ждет восстановления потерянного сегмента. То есть при потере на уровне IP все параллельные запросы HTTP/2 притормаживаются – это неизбежное свойство TCP (гарантия упорядоченной доставки байт). Для решения этой проблемы в будущем появился HTTP/3 на базе протокола QUIC (UDP + встроенный контроль потока на стримы), устраняющего HOL-блокировку на транспорте. Но HTTP/3 – более новая технология, пока не получившая столь же широкого распространения. В контексте gRPC важно, что на момент его разработки (2015 г.) оптимальным выбором транспорта был именно HTTP/2, как наиболее совершенный и универсальный стандарт.

Итак, что дала нам эра HTTP/2:

Параллельность без множества соединений: одно соединение между клиентом и сервером используется максимально эффективно, передавая много запросов одновременно. Уходят в прошлое хитрости вроде шардирования доменов и ограничения 6 соединениями – теперь фактически одно соединение может заменить собой все шесть и работать быстрее.
Снижение задержек на приложении: быстрые операции не ждут медленные. Если один поток задержан, другие продолжаются независимо. Страница загружается более равномерно.
Экономия ресурсов: меньше TCP handshake’ов, меньшая конкуренция за полосу (одно соединение лучше разгружает буфер TCP, чем несколько медленных), сжатые заголовки сокращают накладные расходы.
Основы для стриминга: HTTP/2 изначально поддерживает долгоживущие двунаправленные потоки (где и клиент, и сервер могут отправлять несколько сообщений). Это легло в фундамент gRPC.

Протокол gRPC был спроектирован с учетом возможностей HTTP/2. Рассмотрим, что представляет собой gRPC и какие задачи он решает для межсервисного взаимодействия.

RPC-подход и появление gRPC

В парадигме REST взаимодействие клиента и сервера строится вокруг ресурсов: клиент оперирует объектами (ресурсами) через стандартные методы (GET/POST/etc.), получая или изменяя представление состояния. Такой подход очень гибок и универсален, но подразумевает передачу данных (например, JSON) и интерпретацию их на стороне получателя, не предполагая жесткой схемы. В противоположность этому, в некоторых случаях удобнее модель RPC (Remote Procedure Call) – когда клиент как бы вызывает метод на сервере, передавая ему параметры и ожидая результат как от локальной функции. RPC подход ближе к объектно-ориентированному или сервисно-ориентированному дизайну: определяются строго типизированные сервисы и методы, которые могут вызываться удаленно.

gRPC – это современная открытая реализация RPC-фреймворка от Google (представлена в 2015 г., передана в CNCF). Она предназначена для высокопроизводительного, интероперабельного обмена сообщениями между распределенными приложениями. В основе gRPC лежат две ключевые технологии:

Протокол HTTP/2 – используется как транспортный уровень. gRPC полностью завязан на HTTP/2 и не поддерживает работу поверх HTTP/1.1 (за исключением специальных режимов через прокси). HTTP/2 обеспечивает мультиплексирование, эффективную загрузку, бинарные фреймы, потоки, что идеально подходит для реализации множественных одновременных вызовов и стриминга данных. Кроме того, HTTP/2 поддерживает постоянное соединение, экономя время на рукопожатиях, и может работать как с шифрованием (HTTPS), так и без, хотя обычно используется TLS.
Protocol Buffers (Protobuf) – бинарный протокол сериализации данных, выступающий в gRPC в роли IDL (Interface Definition Language) и формата обмена. Разработчик определяет сервисы, методы и структуры сообщений в виде .proto-схемы. На основе этой схемы генерируется код (стабы клиента и сервера) для различных языков, который уже умеет кодировать данные в двоичном виде и декодировать обратно, а также реализует RPC-вызовы. Protobuf обеспечивает компактность и скорость: сообщения в бинарном формате меньше и быстрее парсятся, чем JSON. Он также строго типизированный и поддерживает эволюцию схем (добавление полей, поддержка optional и т.д.) без нарушения совместимости при соблюдении правил.

Архитектура gRPC следующая: разработчик определяет, например, сервис UserService с методом GetUser(UserRequest) returns (UserResponse). Инструментарий Protobuf генерирует на языке (Java, Go, C# etc.) класс-сервис для сервера (с абстрактным методом GetUser для реализации) и класс-клиент (stub) с методом getUser(request) для вызова. Клиентский stub внутри себя берет ваш запрос-объект, сериализует в Protobuf (получается двоичный массив байтов), затем формирует HTTP/2 сообщение (HTTP POST с определенными заголовками) и отправляет через открытое HTTP/2 соединение на сервер. Серверная сторона (gRPC library) по тому же соединению получает сообщение в виде потока байтов, собирает его, десериализует через Protobuf в UserRequest объект и передает вашей реализаци сервиса. Та формирует ответ UserResponse, который затем библиотека gRPC сериализует обратно в байты и отсылает через HTTP/2 stream назад клиенту. Клиентский stub читает ответ, десериализует его и возвращает готовый объект как результат вызова. Для приложения это выглядит как обычный локальный вызов функции, хотя по факту был произведен сетевой обмен.

Таким образом, gRPC делает удаленный вызов процедур прозрачным и эффективным, благодаря сочетанию HTTP/2 и Protobuf. Сильные стороны gRPC можно обобщить так:

Высокая производительность и малые накладные расходы: передача данных в бинарном виде (Protobuf) и отсутствие лишних упаковок в текстовые форматы дают выигрыш в скорости и трафике. Например, двоичные сообщения Protobuf занимают существенно меньше байт, чем эквивалентные JSON, и быстро разбираются (числа не парсятся из текста, строки не экранируются и т.п.). По данным Google, gRPC способен выдерживать миллионы RPC-вызовов в секунду при должной масштабируемости инфраструктуры.
Мультиплексирование и одновременные вызовы: благодаря HTTP/2, один клиент может иметь десятки одновременных RPC-вызовов через одно соединение, и все они будут независимо выполняться. Нет нужды заводить отдельное соединение на каждый параллельный запрос, как в HTTP/1.1, что снижает нагрузку и максимизирует пропускную способность канала.
Стриминг и двунаправленная связь: gRPC из коробки поддерживает несколько моделей взаимодействия, включая передачу потоков данных. Сервер может отправлять последовательность ответов на один запрос (Server streaming), клиент может отправлять поток запросов (Client streaming), и самое мощное – обе стороны могут одновременно вести диалог, обмениваясь потоками сообщений (Bidirectional streaming). Все это возможно благодаря долгоживущим HTTP/2 потокам. В HTTP/1.1 подобное требовало бы веб-сокетов или длительных опросов, с большими сложностями. В gRPC двунаправленный стриминг реализован во фреймворке и прост в использовании.
Строгий контракт и авто-генерация кода: API в gRPC явно описывается в .proto файле – это контракт между сервисом и клиентами, содержащий все типы данных и методы. На основе него автоматически генерируются коды на нужных языках, что гарантирует, что и клиент, и сервер следуют одному контракту. Сильная типизация снижает число ошибок – несоответствие типов выявится на этапе компиляции, тогда как в REST JSON ошибки вылезают только в рантайме. Кроме того, генерация избавляет от ручного написания шаблонного кода: de/serialize, составление HTTP-запросов – все это делает сгенерированный stub. Для крупных систем, где есть клиенты на разных языках, gRPC значительно упрощает поддержку многоплатформенности (достаточно сгенерировать код для Python, Java, etc. из одного контракта).
Встроенные механизмы управления: gRPC фреймворк предоставляет ряд полезных возможностей: встроенные коды статусов ошибок (аналог HTTP статусов, но расширенные для RPC), удобную обработку метаданных (аналог HTTP-заголовков, можно передавать дополнительную информацию), настроенные тайм-ауты и отмену вызова. Например, клиент gRPC может задать дедлайн (deadline) для RPC, и если время вышло – автоматически отменить запрос, причем серверская библиотека об этом узнает и может прервать выполнение на сервере. В HTTP/1.1 такая координация сложна – если клиент обрывает соединение, сервер не всегда может это отловить сразу, а прокси между ними могут не уведомить. gRPC же облегчает разработку надежных связей. Также поддерживаются Interceptor–ы (аналог middleware, можно внедрять логирование, аутентификацию), health-check и др.
Безопасность и сжатие: gRPC изначально рассчитан на безопасную передачу – как правило, используется TLS шифрование (именно поэтому зачастую gRPC требует HTTP/2 через TLS/ALPN). Также поддерживается встроенное сжатие сообщений. Фреймворк имеет механизмы аутентификации – можно интегрировать с mTLS, OAuth токенами, поддерживается Google’s API auth и т.д.

При всех плюсах, gRPC имеет и побочные эффекты/сложности, о которых надо знать:

Сложность отладки: бинарные сообщения не прочитать “вручную”. Если REST API можно протестировать через curl или открыть ответ в браузере и сразу увидеть JSON, то gRPC требует специальных утилит (например, grpcurl, BloomRPC) или писать клиентский код. Логирование тоже сложнее: в логе надо либо выводить распарсенные сообщения, либо работать с их двоичным представлением. Это повышает порог входа для новичков и затрудняет debug на продакшене (нужны прокси-снифферы, поддерживающие HTTP/2 frames).
Необходимость генерации и поддержки кода: вместо того, чтобы просто написать обработку HTTP-запроса, разработчик должен поддерживать .proto-схемы и вызывать генератор кода при изменениях. Сгенерированный код может быть громоздким и не всегда “красивым” для восприятия. Хотя современные инструменты сглаживают эти моменты, первоначальная настройка окружения (установка protoc компилятора, подключение плагинов для нужного языка) – дополнительный шаг в процессе разработки. Для некоторых языков (например, фронтенд JavaScript/TypeScript) экосистема генераторов пока менее зрелая, приходилось полагаться на сторонние решения, что тоже добавляет головной боли.
Меньшая гибкость и распространенность: REST по сути – стиль архитектуры, его можно реализовать как угодно, а gRPC – конкретный фреймворк со строгими требованиями (HTTP/2, определенные паттерны). Это означает меньше свободы в реализации, но и меньше вариативности. Однако недостаток в том, что gRPC – относительно новая технология (с 2015 г.), и хотя набрала популярность, она далеко не везде поддерживается. Например, веб-браузеры не умеют напрямую работать с gRPC из-за отсутствия полного контроля над HTTP/2-фреймами и трейлерами – для этого создан специальный посредник gRPC-Web, который транслирует вызовы в понятный браузеру формат. Это усложняет создание веб-клиентов. Также не во всех языках gRPC сразу стал “гражданином первого сорта” – по сравнению с HTTP-клиентами, библиотек gRPC меньше и они сложнее. В результате, gRPC чаще применяется для внутренних микросервисов, а открытые публичные API продолжают использовать REST/HTTP.
Совместимость с имеющейся инфраструктурой: многие существующие решения – балансировщики, шлюзы, прокси – исторически заточены под HTTP/1.1 (например, умеют терминировать TLS и разбирать заголовки, делать rewrite URL и т.п.). Внедрение gRPC может требовать обновления инфраструктуры (поддержка HTTP/2 proxy), настройки протоколов. Хотя сейчас уже многие балансировщики (NGINX, Envoy) поддерживают проксирование gRPC, некоторое время были проблемы. Также, мониторинг трафика, отладочные прокси – все инструменты привыкли к текстовому HTTP, а двоичный поток сложнее анализировать.

В целом, минусы gRPC не столько в самом протоколе, сколько во внешней совместимости и сложности экосистемы. Взамен мы получаем мощный инструмент для высоконагруженных распределенных систем. Далее мы подробно рассмотрим модели взаимодействия в gRPC и приведем примеры, как ими пользоваться на практике.

Типы RPC-взаимодействия в gRPC

Как упоминалось, gRPC поддерживает четыре основных режима вызовов, в отличие от классического HTTP, где фактически реализован только один шаблон “запрос-ответ”. Раскроем эти режимы:

Unary RPC (одноточечный запрос-ответ): самый простой случай – клиент отправляет единичный запрос и получает единичный ответ от сервера. Это прямая аналогия с обычным REST-запросом (например, HTTP POST и получение JSON). В gRPC подавляющее большинство методов, как правило, unary. Пример: GetUser(GetUserRequest) returns (GetUserResponse) – клиент запрашивает пользователя по ID, сервер возвращает данные пользователя. С точки зрения реализации, такой вызов блокируется на клиенте до получения ответа (в блокирующем stub) или возвращает Future/коллбэк (в асинхронном). Взаимодействие строго 1:1.
Server-side Streaming RPC (серверный стриминг): клиент отправляет один запрос, а сервер возвращает поток ответов. То есть, вызывая метод, клиент получает не единственный результат, а последовательность сообщений, которые приходят по мере готовности. Это полезно, когда нужно передать много записей или вести подписку на события. Пример: метод ListUsers(ListUsersRequest) returns (stream User) – клиент запрашивает список (может быть с фильтрацией), и сервер потоком шлет объекты User до конца списка. При этом на TCP/HTTP уровне это один HTTP/2 stream, внутри которого множество сообщений ответа. Клиент gRPC получает специальный итератор или коллбэки для обработки последовательности. Важно, что клиент при желании может досрочно отменить стрим (отправив сигнал отмены), если ему больше не нужны данные.
Client-side Streaming RPC (клиентский стриминг): в этом режиме клиент отправляет поток запросов на сервер, а сервер по получении всех (или по ходу) отвечает единым ответом. Это как зеркальный случай предыдущего. Например, метод UploadStatistics(stream StatRecord) returns (UploadResult) – клиент посылает последовательность записей (скажем, метрик или частей файла), сервер читает их (может накапливать, агрегировать) и затем возвращает результат обработки (например, OK и суммарную статистику). Тут уже инициатива у клиента: он открывает стрим, пишет в него много сообщений. Сервер может начать обработку до того, как все получит (потоковая обработка), но ответ пришлет один по завершении (или может прервать с ошибкой). Для клиента такой метод обычно представлен в виде возможности передать итератор/писатель объектов, или вызывать специальный метод stub для отправки каждого следующего сообщения.
Bidirectional Streaming RPC (двунаправленный стриминг): наиболее сложный, но и самый гибкий вариант – оба участника обмениваются потоками данных одновременно. Клиент и сервер независимо отправляют сообщения друг другу через единый разделяемый канал. Это фактически аналог двунаправленного сокета с сообщениями прикладного уровня. Данный режим позволяет построить настоящие realtime-сервисы: чаты, обмен событиями, интерактивные протоколы. Пример: Chat(stream ChatMessage) returns (stream ChatMessage) – обе стороны могут отправлять сообщения типа ChatMessage в любом порядке, пока не решат завершить диалог. В gRPC реализация предоставит на клиенте и сервере интерфейс чтения и записи в поток. Важно понимать, что порядок доставки внутри каждого направления сохраняется (сообщения от клиента придут серверу в том порядке, как отправлены), но клиент и сервер делают это асинхронно. Например, сервер может начать посылать ответы, не дожидаясь конца клиентского потока.

Использование стриминга – одно из ключевых отличий gRPC от традиционных REST/HTTP API. Хотя HTTP/2 сам по себе позволяет серверу отправлять несколько частей ответа (например, Server-Sent Events или chunked transfer), в gRPC это выведено на уровень абстракции методов, что удобнее и надежнее.

Рассмотрим в качестве примера сценарий двунаправленного стриминга – диалог клиента и сервера (например, чат с обслуживанием запроса). Ниже приведена диаграмма последовательности (sequence diagram), иллюстрирующая обмен сообщениями между клиентом и сервером в рамках одного bidi-стрима:

Рис. 3: сценарий двунаправленного стриминга – диалог клиента и сервера

В этом условном примере по одному открытому gRPC-потоку происходит диалог: клиент последовательно отправляет реплики (“Привет”, запрос баланса, OTP), сервер отвечает репликами (“Здравствуйте…”, запрос OTP, результат баланса). Оба участника используют поток в обоих направлениях, пока разговор не завершается. Подобным образом могут работать системы мгновенного обмена сообщениями, онлайн-консультации, игровые приложения – где требуется, чтобы и клиент, и сервер реагировали на действия друг друга в режиме реального времени. gRPC гарантирует, что все эти сообщения передаются по одному TCP-соединению без блокировок и задержек, кроме тех, что обусловлены реальным временем обработки на каждой стороне.

Стоит отметить, что за каждым из таких взаимодействий скрывается определенная логика буферизации и потока управления: например, сервер может обрабатывать поступающие сообщения клиента последовательно или параллельно, может приостановить чтение (Flow Control HTTP/2 позволяет не захлебнуться, сигнализируя отправителю). Но в большинстве случаев для разработчика эти детали прозрачны – gRPC runtime сам оптимально управляет окнами протокола.

Когда использовать стриминг? Если нужно передать большой объем данных частями – server streaming позволит начать обработку/отображение результатов не дожидаясь всего объема (похоже на пагинацию, но в одном соединении). Если нужно получать непрерывные обновления (например, поток цен, лог событий) – отлично подходит server streaming или bidi (если еще и отправлять команды). Client streaming удобен для загрузки данных: разбиваем большой файл или множество записей на последовательность мелких сообщений (это лучше, чем одним огромным сообщением нагрузить память). Bidi streaming – для интерактивных протоколов, где обе стороны равноправно инициируют обмен.

Отдельно подчеркнем: REST (HTTP/1.1) не имеет встроенной поддержки двунаправленного обмена. Максимум – длинные опросы или webhooks, что неудобно, либо WebSocket, который требует иной технологии. HTTP/2 частично улучшил ситуацию (можно сделать server push, использовать long polling эффективнее), но до гибкости полноценного двунаправленного RPC ему далеко. Так что gRPC в плане гибкости коммуникаций предоставляет разработчикам новый уровень возможностей.

После теории перейдем к практике – посмотрим, как реализовать сервис на gRPC в среде Spring Boot (Java) и как воспользоваться разными видами вызовов.

Практический пример: gRPC в приложении Spring Boot

Рассмотрим пошагово создание простого gRPC-сервиса и клиента на языке Java (актуальная версия Java 24) в рамках Spring Boot 3.5+. Spring Boot не включает нативной поддержки gRPC из коробки, но есть доступные стартеры (например, Lognet gRPC Spring Boot Starter или Yidongnan Spring Boot gRPC) и, конечно, можно интегрировать вручную с минимальными усилиями. Мы воспользуемся стандартными инструментами gRPC (компилятор protoc и библиотека grpc-java) и покажем, как вписать их в Spring-приложение.

1. Зависимости Maven/Gradle. Прежде всего, в проект нужно добавить зависимости на gRPC и Protobuf. Минимальный набор для Java включает: grpc-netty (транспорт на Netty или grpc-netty-shaded), grpc-protobuf (runtime для Protobuf) и grpc-stub (для генерации клиентских и серверных заглушек) – версии лучше брать последние стабильные (на момент 2025 г., например, 1.59.0 или выше). Плюс необходим плагин для сборки – protobuf-maven-plugin – который вызовет генерацию кода из .proto файлов. Если используем Spring Boot Starter для gRPC (например, от Lognet), он сам подтянет нужные зависимости и упростит конфигурацию сервера. Ниже фрагмент pom.xml с необходимыми зависимостями:

<dependency>
    <groupId>io.grpc</groupId>
    <artifactId>grpc-netty-shaded</artifactId>
    <version>1.59.0</version>
</dependency>
<dependency>
    <groupId>io.grpc</groupId>
    <artifactId>grpc-protobuf</artifactId>
    <version>1.59.0</version>
</dependency>
<dependency>
    <groupId>io.grpc</groupId>
    <artifactId>grpc-stub</artifactId>
    <version>1.59.0</version>
</dependency>
<!-- Spring Boot Starter for gRPC (optional, for auto-config) -->
<dependency>
    <groupId>org.lognet</groupId>
    <artifactId>spring-boot-starter-grpc</artifactId>
    <version>4.6.0</version>
</dependency>

И настроим плагин в разделе <build><plugins>:

<plugin>
  <groupId>com.google.protobuf</groupId>
  <artifactId>protobuf-maven-plugin</artifactId>
  <version>0.6.1</version>
  <configuration>
    <protocArtifact>com.google.protobuf:protoc:3.24.0:exe:${os.detected.classifier}</protocArtifact>
    <pluginId>grpc-java</pluginId>
    <pluginArtifact>io.grpc:protoc-gen-grpc-java:1.59.0:exe:${os.detected.classifier}</pluginArtifact>
    <protoSourceRoot>${project.basedir}/src/main/proto</protoSourceRoot>
  </configuration>
  <executions>
    <execution>
      <goals>
        <goal>compile</goal>
        <goal>compile-custom</goal>
      </goals>
    </execution>
  </executions>
</plugin>

Этот плагин при сборке найдет наши .proto файлы и сгенерирует Java-классы (как в папку target/generated-sources).

2. Определение .proto-файла (IDL). Создадим файл src/main/proto/bank_service.proto – опишем в нем сервис BankService с методами, демонстрирующими все типы взаимодействия, и необходимые сообщения. Например, такой интерфейс банка: проверка баланса (unary), загрузка выписки (server streaming), пополнение счета (client streaming), чат с поддержкой (bidirectional).

syntax = "proto3";
package banking;

// Сервис банка с четырьмя методами
service BankService {
  // Unary RPC: запрос баланса счета
  rpc GetBalance (BalanceRequest) returns (BalanceResponse);
  // Server streaming RPC: выгрузка транзакций (например, выписка)
  rpc GetTransactions (TransactionsRequest) returns (stream Transaction);
  // Client streaming RPC: пополнение счета несколькими платежами
  rpc Deposit (stream DepositRequest) returns (DepositResponse);
  // Bidirectional streaming RPC: чат с поддержкой банка
  rpc SupportChat (stream ChatMessage) returns (stream ChatMessage);
}

// Запрос баланса содержит номер счета
message BalanceRequest {
  string account_id = 1;
}
// Ответ с балансом
message BalanceResponse {
  string account_id = 1;
  double balance = 2;
}

// Запрос на получение транзакций за период
message TransactionsRequest {
  string account_id = 1;
  string from_date = 2;
  string to_date = 3;
}
// Сообщение транзакции (упрощенно)
message Transaction {
  string date = 1;
  string description = 2;
  double amount = 3;
}

// Запрос на пополнение счета (набор платежей)
message DepositRequest {
  string account_id = 1;
  double amount = 2;
}
// Итоговый ответ на пополнение
message DepositResponse {
  string account_id = 1;
  double new_balance = 2;
  int32 processed_count = 3; // сколько платежей обработано
}

// Сообщение чата
message ChatMessage {
  string from = 1;    // "client" или "support"
  string message = 2;
}

Здесь мы описали четыре RPC: GetBalance – unary, возвращает баланс; GetTransactions – возвращает поток транзакций; Deposit – принимает поток запросов на депозит, возвращает один ответ (итоговое состояние); SupportChat – двунаправленный стрим, обмен сообщениями. Также определены необходимые структуры данных (в proto3 синтаксе все поля необязательные по умолчанию, но мы логически ожидаем некоторые всегда заполнены).

3. Генерация и реализация сервера. После написания .proto, выполняем mvn compile – плагин protoc сгенерирует классы. Для каждого RPC метода будет сгенерирован абстрактный класс службы с методом-обработчиком. Например, появится класс BankServiceGrpc.BankServiceImplBase с методами:

public void getBalance(BalanceRequest, StreamObserver<BalanceResponse>)
public void getTransactions(TransactionsRequest, StreamObserver<Transaction>)
public StreamObserver<DepositRequest> deposit(StreamObserver<DepositResponse>)
public StreamObserver<ChatMessage> supportChat(StreamObserver<ChatMessage>)

Обратите внимание: для unary и server-streaming RPC метод сразу принимает StreamObserver для отправки ответа(ов). Для client-streaming и bidi метод возвращает StreamObserver – это обработчик входящих сообщений от клиента, с помощью которого сервер будет получать запросы.

Наша задача – создать класс, например BankServiceImpl, наследующий BankServiceImplBase, и реализовать эти методы. В контексте Spring Boot, можно сделать этот класс бином (@Service или даже специальная аннотация @GrpcService если используем стартер) – gRPC сервер при старте найдет и зарегистрирует его.

Вот упрощенный пример реализации некоторых методов:

@Service // регистрируем как Spring-бин
public class BankServiceImpl extends BankServiceGrpc.BankServiceImplBase {

@Override  
public void getBalance(BalanceRequest request, StreamObserver<BalanceResponse> responseObserver) {  
    String accountId = request.getAccountId();  
    // Логика получения баланса (например, из базы)  
    double balance = accountService.getBalance(accountId);  
    BalanceResponse response = BalanceResponse.newBuilder()  
            .setAccountId(accountId)  
            .setBalance(balance)  
            .build();  
    // Отправляем ответ и закрываем стрим  
    responseObserver.onNext(response);  
    responseObserver.onCompleted();  
}

@Override  
public void getTransactions(TransactionsRequest request, StreamObserver<Transaction> responseObserver) {  
    List<Transaction> transactions = transactionService.getTransactions(request.getAccountId(),  
                                                                        request.getFromDate(), request.getToDate());  
    // Стриминг: отправляем каждую транзакцию отдельным сообщением  
    for (Transaction txn : transactions) {  
        responseObserver.onNext(txn);  
    }  
    // По завершении отправки закрываем стрим  
    responseObserver.onCompleted();  
}

@Override  
public StreamObserver<DepositRequest> deposit(StreamObserver<DepositResponse> responseObserver) {  
    return new StreamObserver<DepositRequest>() {  
        double totalAmount = 0;  
        int count = 0;  
        String accountId = "";  
        @Override  
        public void onNext(DepositRequest req) {  
            accountId = req.getAccountId();  
            totalAmount += req.getAmount();  
            count++;  
            // сразу можем обновлять баланс постепенно или копить  
        }  
        @Override  
        public void onError(Throwable t) {  
            System.err.println("Error in deposit stream: " + t);  
        }  
        @Override  
        public void onCompleted() {  
            // Когда клиент закончил отправку, обработаем итог  
            double newBalance = accountService.deposit(accountId, totalAmount);  
            DepositResponse resp = DepositResponse.newBuilder()  
                    .setAccountId(accountId)  
                    .setNewBalance(newBalance)  
                    .setProcessedCount(count)  
                    .build();  
            responseObserver.onNext(resp);  
            responseObserver.onCompleted();  
        }  
    };  
}

@Override  
public StreamObserver<ChatMessage> supportChat(StreamObserver<ChatMessage> responseObserver) {  
    return new StreamObserver<ChatMessage>() {  
        @Override  
        public void onNext(ChatMessage message) {  
            if ("client".equals(message.getFrom())) {  
                // Клиент отправил сообщение – эмулируем ответ от поддержки  
                String clientText = message.getMessage();  
                // Простая логика ответа:  
                ChatMessage reply = ChatMessage.newBuilder()  
                        .setFrom("support")  
                        .setMessage("Вы сказали: " + clientText + "\", мы скоро ответим.")  
                        .build();  
                responseObserver.onNext(reply);  
            }  
        }  
        @Override public void onError(Throwable t) { }  
        @Override public void onCompleted() {  
            // Завершаем при окончании стрима  
            responseObserver.onCompleted();  
        }  
    };  
}

}

Здесь:

getBalance – простой unary: сразу формируем ответ.
getTransactions – проходим по списку и каждую транзакцию onNext отсылаем клиенту. После цикла – onCompleted() сигнализирует конец потока.
deposit – возвращаем observer, который собирает суммы из поступающих запросов. Когда клиент закончит (вызывает onCompleted), сервер вычисляет новый баланс и отправляет единый ответ.
supportChat – для каждого входящего сообщения клиента мы отправляем ответ. В реальности это мог бы быть relaying в отдел поддержки. Заметьте, мы не ждем окончания стрима, а отвечаем на ходу. Поток завершается, когда клиент вызовет завершение – тогда мы тоже вызываем onCompleted для ответного observer.

С помощью Spring Boot мы еще должны настроить запуск gRPC-сервера. Если использовали spring-boot-starter-grpc, то, как правило, достаточно указать порт в настройках (grpc.port=9090 например) – стартер сам поднимет Netty-сервер и зарегистрирует наши сервисы. Если без стартера, то в методе main нужно вручную создать и запустить сервер:

Server server = ServerBuilder.forPort(9090)
    .addService(new BankServiceImpl())
    .build()
    .start();

и не забыть shutdown hook. Но такие детали опустим ради краткости.

4. Реализация gRPC клиента. Клиентскую часть можно встроить в другое приложение Spring Boot, или даже в то же самое (для вызова другого сервиса). Чтобы сделать вызов gRPC, нам нужен Channel (настроенное подключение) и сгенерированный stub. gRPC Java предлагает несколько видов stub: blocking stub (синхронные методы), future stub (возвращающие ListenableFuture) и async stub (где методы сразу принимают StreamObserver для callback-ов). Для простоты используем блокирующий stub – он будет при вызове метода дожидаться ответа, подобно обычному вызову функции.

Создание канала:

ManagedChannel channel = ManagedChannelBuilder.forAddress("localhost", 9090)
        .usePlaintext() // без TLS для локальных тестов
        .build();
BankServiceGrpc.BankServiceBlockingStub stub = BankServiceGrpc.newBlockingStub(channel);

После этого stub имеет методы, соответствующие RPC. Unary и server-streaming методы представлены простыми вызовами (server-streaming возвращает итератор или специальный BlockingIterator). А вот client-streaming и bidi-streaming на blocking stub не поддерживаются (они доступны только в async form). Для них пришлось бы использовать BankServiceStub asyncStub = BankServiceGrpc.newStub(channel) и затем вызывать, например, asyncStub.deposit(responseObserver) – получив StreamObserver для отправки запросов, либо asyncStub.supportChat(chatObserver).

Пример вызова unary и server-streaming с блокирующим stub:

// Unary call example:
BalanceRequest req = BalanceRequest.newBuilder().setAccountId("12345").build();
BalanceResponse resp = stub.getBalance(req);
System.out.println("Баланс счета: " + resp.getBalance());

// Server streaming call example:
TransactionsRequest treq = TransactionsRequest.newBuilder()
        .setAccountId("12345")
        .setFromDate("2023-01-01").setToDate("2023-12-31")
        .build();
Iterator<Transaction> txnStream = stub.getTransactions(treq);
while (txnStream.hasNext()) {
    Transaction txn = txnStream.next();
    System.out.println("Транзакция: " + txn.getDate() + " " + txn.getAmount());
}
System.out.println("Все транзакции получены.");

Для streaming методов в реальном клиенте likely мы бы использовали асинхронный stub. Например, client-streaming:

StreamObserver<DepositResponse> responseObs = new StreamObserver<>() { ... };
StreamObserver<DepositRequest> requestObs = asyncStub.deposit(responseObs);
// отправляем несколько запросов
requestObs.onNext(DepositRequest.newBuilder().setAccountId("12345").setAmount(100).build());
requestObs.onNext(DepositRequest.newBuilder().setAccountId("12345").setAmount(50).build());
...
requestObs.onCompleted(); // завершить поток

И bidi:

StreamObserver<ChatMessage> chatResponseObs = new StreamObserver<>() {
    public void onNext(ChatMessage msg) { System.out.println("Support: " + msg.getMessage()); }
    ... 
};
StreamObserver<ChatMessage> chatRequestObs = asyncStub.supportChat(chatResponseObs);
chatRequestObs.onNext(ChatMessage.newBuilder().setFrom("client").setMessage("Привет").build());
// далее, можно из другого потока слушать ввод пользователя и слать в onNext...

В ответном observer мы печатаем сообщения от сервера (поддержки). Когда пользователь решит закончить чат:

chatRequestObs.onCompleted();

и ожидаем, что сервер тоже закроет свой поток.

Естественно, в реальном приложении эти вызовы будут обернуты в сервисы, контроллеры или иные компоненты, вызываемые по расписанию или по событию UI. Но на данном уровне достаточно понять, что gRPC-клиент – это такой же потребитель API, только API у нас не REST endpoints, а методы сервиса, вызываемые через сгенерированный stub.

5. Диаграмма C4: архитектура с использованием gRPC. Чтобы увидеть общую картину, представим типичную архитектуру, где gRPC применяется для внутренних взаимодействий, а с внешними клиентами работает REST. Ниже приведена диаграмма Containers (C4 Model), отображающая, например, фронтенд-приложение, API-шлюз и два микросервиса, общающихся по gRPC:

Рис. 4: архитектура с использованием gRPC.

На этой схеме показано:

Пользователь в браузере работает с одностраничным приложением (SPA), которое общается с сервером через обычный REST API (HTTP/1.1 + JSON). Это сделано для совместимости – браузер не умеет напрямую в gRPC.
API Gateway (или BFF – backend-for-frontend) реализован на Spring Boot с обычными контроллерами. Он принимает внешние запросы и далее вызывает внутренние сервисы.
Внутри периметра имеются микросервисы: Account Service и Support Service, которые общаются с API Gateway по gRPC. Например, API Gateway при вызове /balance делает gRPC-вызов GetBalance Account-сервиса; или при организации веб-чата API Gateway устанавливает gRPC-стрим с сервисом поддержки и проксирует сообщения от веб-сокета пользователя.
Account Service использует свою базу данных PostgreSQL для хранения. Support Service, предположим, может обращаться к каким-то другим ресурсам (не отражено для простоты).

Такая архитектура отражает реальную практику: gRPC часто внедряется внутри комплекса микросервисов, где все компоненты контролируются разработчиками, и можно обеспечить поддержку протокола. Для внешних же клиентов (мобильных, веб) нередко выставляют фасад, который либо предоставляет REST/JSON API, либо использует gRPC-Web (специальный прокси) – т.е. адаптирует коммуникацию под возможности клиента. Причина – обеспечить совместимость и удобство использования для широкой аудитории разработчиков, ведь REST по-прежнему проще интегрировать и тестировать.

Когда HTTP/1.1 (REST) все еще предпочтителен, а где стоит применять gRPC

Вопрос, который естественно возникает: если gRPC такой эффективный, почему же мир не отказался от REST/HTTP/1.1 поголовно? Рассмотрим ситуации и критерии, влияющие на выбор.

Когда лучше остаться на REST (HTTP/1.1/HTTP/2):

Широкая клиентская совместимость и простота интеграции. Если ваш API предназначен для сторонних разработчиков, для вызова из браузеров, из разнообразных сред – REST будет понятнее и доступнее. Практически любой язык имеет HTTP-клиент из коробки, работы с JSON понятна повсеместно. Разработчики могут вручную вызвать API через curl или Postman и быстро увидеть результат. В случае gRPC требуется генерация клиента или использование специальных средств – порог выше. Поэтому открытые публичные API, SDK библиотек для партнеров зачастую выбирают REST, чтобы снизить барьеры и привлечь больше интеграторов. Браузерные приложения напрямую могут обращаться только к HTTP/1.1/2 endpoints (или WebSocket), но не к raw gRPC, так что для SPA или мобильного приложения проще работать с REST/JSON, чем тянуть gRPC-Web или выполнять бинарную десериализацию на клиенте.
Экосистема и инструменты. Окружение вокруг REST зрело: есть отладочные прокси, трейсеры HTTP, масштабируемые API-шлюзы, средства документирования (OpenAPI/Swagger) и пр. С gRPC тоже появилось немало инструментов, но, например, для автоматической генерации документации REST достаточно аннотаций и генератора Swagger UI, а для gRPC API такой интерактивности нет – придется либо вручную писать описание, либо генерировать Markdown из .proto, что редко делается. Кеширование на прокси (CDN) – еще один момент: HTTP-кэши заточены под ресурсы, они “понимают” заголовки Cache-Control, ETag. gRPC-ответы тоже можно теоретически кешировать (если обернуть в прокси с HTTP), но нет общепринятых практик. Поэтому для контента, который хорошо кешируется (статические ответы), REST все еще проще внедрить.
Не нужна сложная производительность. Если у вас небольшой сервис или низкие нагрузки, выгода от бинарного протокола может быть несущественной. REST+JSON “достаточно быстрый” для большинства человеческих масштабов. Например, админ-приложение с десятком запросов – нет смысла усложнять его gRPC, когда HTTP справится, а код писать проще. Текстовые протоколы легче поддерживать, когда оптимизация не главная цель.
Эластичная схема и эволюционное развитие. В REST можно легче игнорировать лишние поля JSON, менять формат без жесткого контрактного контроля – это как и плюс (гибкость), так и минус (отсутствие явного контракта). Но когда API быстро меняется или не строго типизирован (например, GraphQL-like сценарии), статичная схема gRPC может быть помехой. REST позволяет выпускать новые версии API параллельно, поддерживать старые – хотя и gRPC это позволяет (добавлением полей, версиями в именах методов), но у клиентов gRPC обычно сгенерированный код – обновить его сложнее, чем просто начать парсить новый JSON.
Смешанная среда и межъязыковые барьеры. Хотя gRPC поддерживает многие языки, бывают случаи, когда клиентская среда не поддерживается. Например, IoT-устройства со специфическими микро-контроллерами, legacy-языки. Для них может не существовать официального gRPC-клиента. Зато отправить HTTP-запрос умеют почти все. В таких случаях REST – язык “интероперабельности” по умолчанию.
Организационные факторы: Обучение команды, наличие экспертизы. Если команда небольшая и хорошо знакома с REST, но не имеет опыта gRPC/Protobuf, возможно, затраты на переобучение и риск ошибок не окупятся преимуществами. Технологии должны упрощать жизнь, а не только быть “хайпом”.

Когда gRPC дает выигрыш и его стоит выбирать:

Высоконагруженные внутренние коммуникации микросервисов. Когда у вас десятки сервисов, обменивающихся сотнями тысяч RPS внутри кластера – накладные расходы REST становятся значительными. gRPC в таких условиях существенно экономит и CPU, и сеть. Плюс, наличие строгих контрактов между сервисами, автогенерация клиентов для разных языков ускоряет разработку. Именно поэтому gRPC популярен в архитектурах Cloud Native, где много взаимодействующих компонент (Netflix, Google, etc. – используют gRPC между сервисами). Полиглотная среда – отдельный плюс: когда один сервис на Java, другой на C++, третий на Python, согласовать формат JSON или Thrift – дополнительные усилия, а gRPC/Protobuf сразу дает готовую межъязыковую сериализацию.
Низкие задержки, требуемые приложением. В системах реального времени – торговые платформы, игровые серверы, обмен сообщениями – счет идет на миллисекунды. gRPC выигрывает за счет отсутствия обработки текстовых форматов и постоянного соединения с мультиплексированием. Например, для чатов или видео-звонков gRPC хорошо подходит (хотя для медиа стримов часто используют UDP, но для сигнализации и управления – gRPC). Кроме того, стриминговые возможности gRPC позволяют реализовать реактивные обновления (как push-уведомления) легко, чего REST не дает. Если нужно двунаправленное взаимодействие, gRPC однозначно лучше: в REST придется строить WebSocket соединение и свой протокол поверх него, а gRPC сразу это умеет.
Четкие контракты и уверенность в данных. В больших командах и системах важна договоренность о формате API. Protobuf-схема, проходящая код-ревью, – отличный артефакт, определяющий договор. Наличие сгенерированных классов избавляет от ручного написания DTO и парсеров, повышает типобезопасность. Кроме того, Protobuf поддерживает эволюцию (новые поля можно добавлять, старые сохраняются для бэк-совместимости), так что микросервис можно обновлять без единовременного обновления всех клиентов – они просто проигнорируют незнакомые поля, а новые смогут начать отправлять, когда будут готовы. (В JSON тоже можно так делать, но отсутствие явной схемы иногда приводит к ошибкам).
Встроенные механизмы управляемости: как отмечалось, дедлайны, отмена запросов, стандартизированные коды ошибок – все это делает взаимодействие надежнее. Например, в распределенной системе можно проставлять deadline на RPC, чтобы цепочка сервисов не висела бесконечно – gRPC сам прервет ниже по цепочке. В HTTP/1.1 подобных возможностей нет (можно прервать запрос, но сервис об этом не узнает своевременно). Если ваша система требует более интеллектуального управления соединениями – gRPC дает инструменты.
Безопасность и метаданные. gRPC легко интегрируется с mTLS (двусторонняя аутентификация каналов) – т.к. это обычно один соединение на сервис, TLS рукопожатие происходит не часто, а потом оно переиспользуется. Передача метаданных (в HTTP/2 это заголовки и трейлеры) может быть использована для контекстной информации – например, токены авторизации, trace-id для распределенного трейсинга (Zipkin/Jaeger интегрируются через интерсепторы), и пр. Конечно, REST тоже это может через заголовки, но в gRPC это унифицировано и поддерживается библиотеками.

Подытоживая: HTTP/1.1+REST остается оптимальным выбором для внешних, публичных и простых API, где важна совместимость, простота и человеко-читаемость. Отчасти благодаря этому REST до сих пор доминирует в вебе. С другой стороны, gRPC – превосходный вариант для внутренних коммуникаций в распределенных системах, требующих высокой производительности и богатых коммуникационных паттернов (стриминг, long-lived connections). Многие организации применяют гибридный подход: внешне предоставляют REST/JSON, а микросервисы общаются между собой по gRPC – так “лучшее из двух миров”.

Стоит также помнить, что HTTP/2 поддерживается и обычными REST-сервисами (например, современные браузеры всегда пытаются использовать HTTP/2). То есть часть преимуществ (мультиплексирование) может быть достигнута и без перехода на gRPC – например, REST API на HTTP/2 избежит HoL-блокировки на уровне запросов. Но HTTP/2 + JSON все равно уступает HTTP/2 + Protobuf по эффективности: последний быстрее парсится и меньше по размеру. Плюс, HTTP/2 не решает проблему двунаправленного обмена по одному запросу – а gRPC решает через streams.

Есть и альтернативы: например, GraphQL over HTTP – тоже работает на одном соединении, может бить запрос на части; или WebSockets – для кастомных протоколов. Но gRPC выгодно отличается стандартностью и тем, что много обязанностей берет на себя, предоставляя разработчику удобный абстрактный интерфейс.

Почему не все сразу перешли на gRPC? Как мы обсудили – инерция существующих систем, огромная инфраструктура вокруг REST, вопросы совместимости с браузерами, и немаловажно – зрелость технологий. gRPC молод: некоторые необходимые функции (рефлексия сервисов, хорошая генерация TypeScript-клиентов) добавились со временем, документации и примеров поначалу было меньше. К 2025 году gRPC стал довольно зрелым, поддержку его добавили AWS API Gateway (в приватных API), многие языки. Тем не менее, браузерная поддержка “из коробки” так и не появилась – приходится использовать gRPC-Web, где есть ограничения (например, не поддерживается HTTP-trailers, что влияет на передачу статуса). Это ограничение коренится в требованиях HTTP/2: gRPC активно использует трейлеры для передачи статус-кода после окончания стрима, а fetch API в браузере долгое время не позволял читать трейлеры. Также, браузеры не дают полный контроль над фреймами HTTP/2 – поэтому нужен промежуточный прокси, превращающий бинарный gRPC в WebSocket или в обычный HTTP. Многие посчитали это слишком сложным для фронтенда и предпочли проверенный REST/JSON. Как говорит один из разработчиков: “Мой совет: не используйте gRPC, если нужно вызывать напрямую из браузера – поддержки нет, придется городить прослойки, теряя преимущества производительности”.

В итоге, выбор между HTTP/REST и gRPC следует делать исходя из требований проекта:

Если упор на производительность, контролируемая среда (микросервисы), нужны стримы – gRPC даст выигрыш.
Если важна простота, открытость, максимальная совместимость – REST будет предпочтительнее.
Не исключено и сосуществование: например, ваш мобильный апп может общаться с сервером по gRPC (есть библиотеки под iOS/Android), а веб-клиент – через REST или gRPC-Web, к одному бэкенду.

Заключение

Мы подробно разобрали различия между традиционным HTTP/1.1 и современным gRPC (HTTP/2) подходом. Ключевые выводы:

HTTP/1.1 страдает от последовательной обработки запросов в одном соединении. Это приводит к неэффективности и задержкам из-за Head-of-Line блокировки, особенно заметным при множестве мелких ресурсов. HTTP/2 решил эту проблему на уровне протокола, введя мультиплексирование – оно убрало блокировки на уровне HTTP, хотя ограничение TCP все еще остается.
gRPC построен поверх HTTP/2 и наследует все его преимущества: единственное соединение для множества одновременных вызовов, сжатые заголовки, потоковое общение. Более того, gRPC фокусируется на модели RPC (вызов методов), предоставляя строго типизированный контракт через Protobuf. Это решает проблемы неоднородности API (как в REST, где каждый пишет по-своему), обеспечивая унификацию и автогенерацию кода клиентов и серверов. В итоге, gRPC повышает эффективность (меньше объем данных, быстрее обработка) и надежность (контроль типов, встроенные механизмы ошибок/отмен).
Protocol Buffers – мощный инструмент сериализации. Он решает проблему избыточности текстовых форматов (экономия трафика ~3-10 раз, ускорение разбора) и обеспечивает совместимость при эволюции API. Но у него есть и побочные эффекты: формат бинарный, человек не прочтет без спецсредств; требуются генераторы кода и дисциплина ведения .proto схем. Зато Protobuf способствует явному докуменированию API – схема .proto описывает все поля и типы, чего иногда не хватает в REST (где документация отдельно от кода).
Все виды стриминга дают gRPC сильное преимущество в реализациях реального времени. Unary RPC эквивалентен привычному запросу, но когда нужен стрим – REST сравниться не может, а gRPC легко реализует сценарии server push, клиентских загрузок потоками, диалогов. Мы увидели на примере, как можно реализовать чат через bidirectional RPC, чего вообще нет в модели REST.
Spring Boot и gRPC вполне совместимы: хоть Spring официально делает ставку на REST (Spring MVC/WebFlux), существуют готовые интеграции, позволяющие запустить gRPC-сервер как часть Spring Boot приложения. Мы на практике определили .proto, сгенерировали сервис и подключили его к Spring Boot, реализовав бизнес-логику. Также написали фрагменты клиентского кода. Как видно, использование gRPC добавляет шаг генерации, но в остальном довольно прямолинейно. Код gRPC-сервиса похож на написание контроллера, просто с другими вызовами API.
Диаграммы помогли визуализировать: на sequence-диаграмме – обмен сообщениями при стриминговом вызове, на контейнерной – место gRPC в архитектуре. В реальных системах gRPC часто выполняет роль связующего звена между микросервисами, тогда как на внешний уровень торчит HTTP/JSON API. Это обусловлено, прежде всего, вопросами поддержки клиентов (особенно браузеров).
Когда что применять: Нет серебряной пули. Мы обсудили, что gRPC лучше внутри доверенного контура, при высоких нагрузках и требованиях к скорости и интерактивности. REST же остается отличным выбором для публичных API и простых сервисов из-за своей простоты и универсальности. Также, если система уже построена на REST и удовлетворяет требованиям, переход на gRPC имеет смысл только при появлении реальных узких мест или новых требований (например, нужно внедрить стриминг или снизить latency межсервисных коммуникаций).

PROSELYTE

Software Engineering

Быстрые API: как gRPC и Protobuf решают ограничения HTTP/1.1

Оглавление

Введение

HTTP/1.1: устройство протокола и проблемы

HOL-блокировка

HOL в HTTP/1.1 (уровень приложения)

Мини-пример (HTTP/1.1, одно соединение)

HOL в TCP (уровень транспорта)

HTTP/2 и остаточный HOL

HTTP/3 (QUIC) и устранение HOL на транспорте

Виды HOL на практике – “карточки”

Симптомы и как диагностировать

Инженерные стратегии смягчения HOL

HTTP/2: мультиплексирование и устранение блокировки

RPC-подход и появление gRPC

Типы RPC-взаимодействия в gRPC

Практический пример: gRPC в приложении Spring Boot

Когда HTTP/1.1 (REST) все еще предпочтителен, а где стоит применять gRPC

Заключение

Related

Оглавление

Введение

HTTP/1.1: устройство протокола и проблемы

HOL-блокировка

HOL в HTTP/1.1 (уровень приложения)

Мини-пример (HTTP/1.1, одно соединение)

HOL в TCP (уровень транспорта)

HTTP/2 и остаточный HOL

HTTP/3 (QUIC) и устранение HOL на транспорте

Виды HOL на практике – “карточки”

Симптомы и как диагностировать

Инженерные стратегии смягчения HOL

HTTP/2: мультиплексирование и устранение блокировки

RPC-подход и появление gRPC

Типы RPC-взаимодействия в gRPC

Практический пример: gRPC в приложении Spring Boot

Когда HTTP/1.1 (REST) все еще предпочтителен, а где стоит применять gRPC

Заключение

Поделиться

Related