Решение проблемы «микровзрыва» в сценарии обхода сетевого трафика

В типичном сценарии применения NPB наиболее проблемной проблемой для администраторов является потеря пакетов, вызванная перегрузкой зеркальных пакетов и сетей NPB. Потеря пакетов в NPB может вызвать следующие типичные симптомы в инструментах внутреннего анализа:

- Сигнал тревоги генерируется, когда индикатор мониторинга производительности службы APM снижается, а также снижается процент успешности транзакций.

- Генерируется сигнал тревоги об исключении индикатора мониторинга производительности сети NPM

- Система мониторинга безопасности не обнаруживает сетевые атаки из-за пропуска событий

- События аудита поведения при потере обслуживания, генерируемые системой аудита обслуживания

... ...

Как централизованная система захвата и распределения для мониторинга обхода, важность NPB очевидна. В то же время, способ, которым он обрабатывает трафик пакетов данных, сильно отличается от традиционного сетевого коммутатора в режиме реального времени, а технология управления перегрузкой трафика многих сетей в режиме реального времени не применима к NPB. Как решить проблему потери пакетов NPB, давайте начнем с анализа первопричины потери пакетов, чтобы увидеть ее!

Анализ первопричины потери пакетов NPB/TAP

Прежде всего, мы анализируем фактический путь трафика и соотношение отображения между системой и входящим и исходящим трафиком уровня 1 или уровня NPB. Независимо от того, какую топологию сети формирует NPB, как система сбора, существует отношение «многие ко многим» на входе и выходе трафика между «доступом» и «выходом» всей системы.

Микро-взрыв 1

Затем мы рассмотрим бизнес-модель NPB с точки зрения микросхем ASIC на одном устройстве:

Микро Взрыв 2

Особенность 1: «Трафик» и «скорость физического интерфейса» входных и выходных интерфейсов асимметричны, что приводит к большому количеству микровсплесков, что является неизбежным результатом. В типичных сценариях агрегации трафика «многие к одному» или «многие ко многим» физическая скорость выходного интерфейса обычно меньше общей физической скорости входного интерфейса. Например, 10 каналов сбора 10G и 1 канал вывода 10G; В сценарии многоуровневого развертывания все NPBBS можно рассматривать как единое целое.

Особенность 2: Ресурсы кэша микросхем ASIC очень ограничены. Что касается наиболее часто используемых в настоящее время микросхем ASIC, то микросхема с емкостью обмена 640 Гбит/с имеет кэш 3-10 Мбайт; микросхема с емкостью обмена 3,2 Тбит/с имеет кэш 20-50 Мбайт. Включая BroadCom, Barefoot, CTC, Marvell и других производителей микросхем ASIC.

Особенность 3: Обычный механизм управления потоком PFC из конца в конец не применим к службам NPB. Суть механизма управления потоком PFC заключается в достижении обратной связи подавления трафика из конца в конец и в конечном итоге в сокращении отправки пакетов в стек протоколов конечной точки связи для уменьшения перегрузки. Однако источником пакетов служб NPB являются зеркальные пакеты, поэтому стратегия обработки перегрузки может быть только отброшена или кэширована.

Ниже представлен типичный микровсплеск на кривой потока:

Микро Взрыв 3

Если взять в качестве примера интерфейс 10G, то на диаграмме анализа тренда трафика второго уровня скорость трафика долгое время поддерживается на уровне около 3 Гбит/с. На диаграмме анализа тренда микромиллисекунд всплеск трафика (MicroBurst) значительно превысил физическую скорость интерфейса 10G.

Ключевые методы смягчения микропорывов NPB

Уменьшить влияние асимметричного несоответствия скорости физического интерфейса- При проектировании сети максимально уменьшите асимметричные скорости ввода и вывода физического интерфейса. Типичный метод — использовать более высокоскоростной интерфейс восходящего канала и избегать асимметричных скоростей физического интерфейса (например, копирование трафика 1 Гбит/с и 10 Гбит/с одновременно).

Оптимизировать политику управления кэшем службы NPB- Общая политика управления кэшем, применимая к сервису коммутации, не применима к сервису пересылки сервиса NPB. Политика управления кэшем статической гарантии + динамического обмена должна быть реализована на основе особенностей сервиса NPB. Чтобы минимизировать влияние микровсплесков NPB в рамках текущих ограничений аппаратной среды чипа.

Внедрить классифицированное управление транспортной инженерией- Внедрить управление классификацией услуг по проектированию приоритетного трафика на основе классификации трафика. Обеспечить качество обслуживания очередей с различными приоритетами на основе пропускной способности очередей категорий и гарантировать, что пакеты трафика услуг, чувствительные для пользователя, могут быть пересланы без потери пакетов.

Разумное системное решение расширяет возможности кэширования пакетов и формирования трафика.- Интегрирует решение с помощью различных технических средств для расширения возможностей кэширования пакетов чипа ASIC. Формируя поток в разных местах, микровсплеск становится микрооднородной кривой потока после формирования.

Решение Mylinking™ для управления микро-всплеском трафика

Схема 1 — Стратегия управления кэшем, оптимизированная для сети + управление приоритетами качества классифицированных услуг в масштабе всей сети

Стратегия управления кэшем оптимизирована для всей сети

Основываясь на глубоком понимании характеристик сервиса NPB и практических бизнес-сценариев большого количества клиентов, продукты сбора трафика Mylinking™ реализуют набор стратегий управления кэшем NPB "статическое обеспечение + динамическое совместное использование" для всей сети, что оказывает хорошее влияние на управление кэшем трафика в случае большого количества асимметричных входных и выходных интерфейсов. Устойчивость к микровсплескам реализуется в максимальной степени, когда текущий кэш чипа ASIC зафиксирован.

Технология обработки Microburst – управление на основе бизнес-приоритетов

Микро-взрыв 4

Когда блок захвата трафика развертывается независимо, он также может быть приоритетным в соответствии с важностью инструмента внутреннего анализа или важностью самих данных сервиса. Например, среди многих инструментов анализа APM/BPC имеет более высокий приоритет, чем инструменты анализа безопасности/мониторинга безопасности, поскольку он включает в себя мониторинг и анализ различных индикаторных данных важных бизнес-систем. Поэтому для этого сценария данные, требуемые APM/BPC, могут быть определены как высокоприоритетные, данные, требуемые инструментами мониторинга безопасности/анализа безопасности, могут быть определены как среднеприоритетные, а данные, требуемые другими инструментами анализа, могут быть определены как низкоприоритетные. Когда собранные пакеты данных поступают во входной порт, приоритеты определяются в соответствии с важностью пакетов. Пакеты с более высоким приоритетом предпочтительно пересылаются после того, как пересылаются пакеты с более высоким приоритетом, а пакеты с другими приоритетами пересылаются после того, как пересылаются пакеты с более высоким приоритетом. Если пакеты с более высоким приоритетом продолжают поступать, пакеты с более высоким приоритетом пересылаются в первую очередь. Если входные данные превышают возможности пересылки выходного порта в течение длительного периода времени, избыточные данные сохраняются в кэше устройства. Если кэш заполнен, устройство в первую очередь отбрасывает пакеты более низкого порядка. Этот механизм управления с приоритетами гарантирует, что ключевые инструменты анализа могут эффективно получать исходные данные трафика, необходимые для анализа в реальном времени.

Технология обработки Microburst - механизм гарантии классификации качества обслуживания всей сети

Микро Взрыв 5

Как показано на рисунке выше, технология классификации трафика используется для различения различных служб на всех устройствах на уровне доступа, уровне агрегации/ядра и уровне вывода, а приоритеты захваченных пакетов перемаркированы. Контроллер SDN централизованно предоставляет политику приоритета трафика и применяет ее к устройствам пересылки. Все устройства, участвующие в работе сети, сопоставляются с различными очередями приоритетов в соответствии с приоритетами, переносимыми пакетами. Таким образом, пакеты с расширенным приоритетом малого трафика могут достичь нулевой потери пакетов. Эффективно решают проблему потери пакетов мониторинга APM и обхода трафика служб специального аудита услуг.

Решение 2 — Кэш системы расширения на уровне ГБ + Схема формирования трафика
Расширенный кэш системы уровня ГБ
Когда устройство нашего блока сбора трафика имеет расширенные функциональные возможности обработки, оно может открыть определенный объем памяти (RAM) устройства в качестве глобального буфера устройства, что значительно улучшает емкость буфера устройства. Для одного устройства сбора, по крайней мере, емкость ГБ может быть предоставлена ​​в качестве кэш-пространства устройства сбора. Эта технология делает емкость буфера нашего устройства блока сбора трафика в сотни раз выше, чем у традиционного устройства сбора. При той же скорости пересылки максимальная длительность микровсплеска нашего устройства блока сбора трафика становится больше. Уровень миллисекунд, поддерживаемый традиционным оборудованием сбора, был повышен до второго уровня, а время микровсплеска, которое может быть выдержано, было увеличено в тысячи раз.

Возможность формирования многоочередного трафика

Технология обработки Microburst — решение на основе кэширования большого буфера + формирования трафика

Микро-взрыв 6

С супербольшой емкостью буфера данные трафика, генерируемые микровзрывом, кэшируются, а технология формирования трафика используется в исходящем интерфейсе для достижения плавного вывода пакетов в инструмент анализа. Благодаря применению этой технологии явление потери пакетов, вызванное микровзрывом, принципиально решено.


Время публикации: 27 февр. 2024 г.