Спорадическая высокая задержка в моей домашней сети

1643
Phrogz

tl; dr В моей домашней сети недавно произошел скачок с 27 мс до 600 мс. Это происходит не всегда, и, кажется, часто происходит ночью. Какое оборудование я должен купить и провести тесты, чтобы определить причину?

Настроить

Мой дом имеет DSL 12Mb / 800kb. Я живу в горах, вдали от других источников Wi-Fi. Исторически (в течение многих лет) я мог пинговать google.com и получать время ~ 27 мс. Если что-то затопит сеть или соединение (iPhone синхронизирует все фотографии с iCloud), пинг перейдет в диапазон 2000-6000 мс. Но обычно все было хорошо.

Однако в последнее время сеть остается привязанной к 600 мс в течение десятков минут за раз. Я не могу найти устройство, которое заполняет сеть. (Он может существовать, но я его не нашел.) Как правило, утром соединение совершенно нормальное, а ночью обычно плохое (именно тогда, когда мы хотим транслировать шоу в постели!)

Во время больших задержек эхо-запросы к другим устройствам в сети (некоторые из которых я пробовал) не изменяются (всегда <2 мс).

Неисправность и сбой с толку

Я приобрел все новое оборудование (модем DSL, маршрутизаторы Wi-Fi, сетевые коммутаторы), чтобы исключить это. Проблема сохраняется. Вот установка:

Phrogz's home network

Я попытался использовать модем DSL в качестве маршрутизатора (PPPoE + DHCP + NAT) с базовыми станциями Wi-Fi в режиме моста. Я попытался перевести DSL-модем в режим прозрачного моста и получить первую версию Airport Extreme для обработки PPPoE, DHCP и NAT. Проблема сохраняется.

Я отключил все проводные соединения (оставив только модем DSL и базовую станцию ​​Wi-Fi). Проблема сохраняется.

Я использовал только модем DSL (с PPPoE) и использовал собственный Wi-Fi. Проблема сохраняется. Я пытался выследить все старые планшеты, телефоны, ноутбуки по Wi-Fi и выключить их. Проблема сохраняется. Я переименовал SSID Wi-Fi и ввел в него пароль, подключив один ноутбук MacBook Pro через Wi-Fi. Проблема сохраняется. Я использовал другой ноутбук через Wi-Fi. Проблема сохраняется.

Я подключил ноутбук напрямую к модему через Ethernet, Wi-Fi отключен на модеме и больше ничего не подключено. Проблема уходит! (Я думаю ... возможно, что проблема была не в том, что я трижды проверял это).

В какой-то момент, просто подключив ноутбук через Ethernet, я включил Wi-Fi для модема, и проблема проявилась сама собой . Задержка пинга сразу же подскочила, как только я включил Wi-Fi, хотя я не верю, что какие-либо устройства были подключены через Wi-Fi.

Я использовал iStumbler, и между плохой задержкой и увеличением шума, похоже, нет никакой корреляции. Действительно, SNR выглядит хорошо последовательно по Wi-Fi.

Помните, что когда вещи плохие, они не всегда плохие. Даже если каждое устройство в доме включено и подключено, бывают случаи, когда задержка падает до 30 мс или около того в течение нескольких секунд (или минут, или часов), прежде чем снова произойдет сбой.

Следующие шаги?

Я думаю, что iStumbler показал мне, что проблема не связана с проблемами RF. (Может я ошибаюсь?) Поэтому я думаю, что это должен быть реальный трафик в сети.

Базовая станция Airport Extreme не поддерживает регистрацию SNMP. Так же как и Actiontec C1000A. У меня нет коммутатора с портом монитора или концентратора. Я никогда не использовал Wireshark раньше.

НО Я ХОЧУ БРОСИТЬ ДЕНЬГИ И ВРЕМЯ В ЭТОЙ ПРОБЛЕМЕ, чтобы РЕШИТЬ ЭТО

Что я должен купить? Где я должен ввести его в мою сеть? Что я должен искать? Как я могу наблюдать за каждым пакетом в сети и строить гистограммы и графики, чтобы определить, разрушает ли одно плохое устройство ситуацию для всех?


Редактировать 1 : DSL Статистика, когда все хорошо

+-----------------+-------------+ | Connection | Status | +-----------------+-------------+ | DSL Downstream: | 15.869 Mbps | | DSL Upstream: | 0.896 Mbps | +-----------------+-------------+ 

DSL Link Статистика

+------------------------------+---------------------+ | Link Statistic | Status | +------------------------------+---------------------+ | Broadband Mode Setting: | Auto Select | | Broadband Mode Detected: | VDSL2 - 8A | | DSL Link Uptime: | 0 Days, 10H:39M:57S | | Retrains: | 1 | | Retrains in Last 24 Hours: | 1 | | Loss of Power Link Failures: | 0 | | Loss of Signal Link Failure: | 0 | | Loss of Margin Link Failure: | 0 | | Link Train Errors: | 0 | | Unavailable Seconds: | 23 | | Estimated Loop Length: | 2250 | | Uncanceled Echo: | N/A | | Transport Mode: | PTM | | Path Parameter: | 201 | | Priority: | 0 | | Service Type: | PTM-Tagged | +------------------------------+---------------------+ 

DSL Power

+--------------+-------------------------+------------------------+ | Levels | Downstream | Upstream | +--------------+-------------------------+------------------------+ | SNR: | 16 dB | 10 dB | | Attenuation: | (DS1)21.7, (DS2)58.8 dB | (US1)4.3, (US2)47.8 dB | | Power: | 16.4 dBm | 7.8 dBm | +--------------+-------------------------+------------------------+ 

DSL Transport

+----------------------+------------------+---------------+ | Transport | Downstream | Upstream | +----------------------+------------------+---------------+ | Packets: | 1482864 | 1088249 | | Error Packets: | 0 | 0 | | 24 Hour Usage: | 1225940.68 Mbits | 2420.93 Mbits | | Total Usage: | 1225940.68 Mbits | 2420.93 Mbits | | 30 Minute Discarded: | 0 | 3930 | +----------------------+------------------+---------------+ 

DSL Channel

+----------------+-------------+-------------+ | Channel | Near End | Far End | +----------------+-------------+-------------+ | Channel Type: | Interleaved | Interleaved | | CRC Errors: | 0 | 0 | | 30 Minute CRC: | 0 | 0 | | RS FEC: | 5873 | 29 | | 30 Minute FEC: | 372 | 0 | +----------------+-------------+-------------+ 

Изменить 2 : отчет DSLReports Bufferbloat

Запуск speedtest во время нормального времени ожидания указывает, что проблема возникает во время загрузки

Graph showing bad bufferbloat during uploading


Пинг раз ночью и ночью

Пик около 22:35 был одним компьютером, начинающим загружать в Dropbox.

enter image description here

enter image description here


Изменить 3 : Техническая поддержка провайдера сказал:

Модем получает больше сигналов, чем положено. Если кабелей недостаточно для переноса нагрузки, которую мы отправляем, мы можем снизить ее до 100%. Чтобы проверить это, я должен понизить сигнал в течение 7 дней, и вы можете наблюдать, лучше ли просматриваете \ интернет. Через 7 дней наш сервер запустит тест и снова усилит ваши сигналы. И к тому времени у нас будет достаточно цифр, что делать дальше.

Наш сервер предоставляет вам больше, чем ваша покупка. Технически это должно сделать интернет быстрее, но если клиент наблюдает пинг и задержку, вызванные трафиком. Мы можем довести его до купленной скорости \ сигнала и наблюдать, являются ли линии DSL в помещении клиента кабелем для переноса нагрузки.

Фактические / обеспеченные / приобретенные скорости.
Down: 15868/15872 / 12128Mbps
Up: 896/896 / 896kbps

1
Вы пытались использовать более быстрый DNS-сервер? Даже если ваш iPhone синхронизируется по беспроводной сети, время пинга на самом деле не объясняется. Ramhound 8 лет назад 0
Модем был заменен? Какой это модем? Какова ваша статистика ADSL? Linef4ult 8 лет назад 0
@ Linef4ult Да, я заменил модем. Это был Actiontec Q1000, и я заменил его на Actiontec C1000A. Меня сейчас нет дома, но когда я туда доберусь, не могли бы вы уточнить, какую статистику ADSL вы ищете? Phrogz 8 лет назад 0
Это статистика по линии. Ухудшенная связь с DSLAM (модем на стороне вашего интернет-провайдера) может вызвать всплески ошибок и, таким образом, периодически возникающие проблемы, подобные этой. Вставьте содержимое страницы, которая выглядит следующим образом: http://screenshots.portforward.com/routers/Actiontec/C1000A_CenturyLink/DSL_Status.jpg Linef4ult 8 лет назад 0
@ Linef4ult Спасибо! Сделаем через ~ 7 часов. Я надеюсь, что это так (что это ошибка провайдера / линии). Тот факт, что я * думал *, что я видел ситуацию, когда только Ethernet решал проблему, а добавление Wi-Fi приводило к ее провалу, наполняет меня FUD, что проблема на моей стороне. Посмотрим! Phrogz 8 лет назад 0
@Phrogz Этот бит не имеет смысла, он охватывает все симптомы, поэтому давайте посмотрим. Пометьте меня в комментарии всякий раз, когда вы публикуете их, и я проверю еще раз. Linef4ult 8 лет назад 0
Я не вижу здесь никакой базовой диагностики сети, такой как * определение того, откуда берется задержка * ... Бросать деньги на проблему следует только после того, как вы узнаете, ** где ** проблема действительно существует. Начните с публикации результатов пингов и трассировок между различными устройствами, пока вы не определите проблему. qasdfdsaq 8 лет назад 0
@qasdfdsaq Сегодня вечером я начну тщательное тестирование. Я испытываю задержку на каждом устройстве (которое я могу пропинговать) к первому прыжку на другой стороне моего модема DSL. Я еще не доказал это (буду сегодня), но я считаю, что задержка в локальной сети - это хорошо. Phrogz 8 лет назад 0
Если в вашей сети задержка в порядке и высока при первом скачке у вашего интернет-провайдера, то проблема связана с вашим интернет-провайдером (особенно, если он хуже в пиковое время, классические симптомы перегрузки интернет-провайдера). Единственное, что вы можете с этим поделать, это позвонить им и подать жалобу или переключить провайдера. Ничто из того, что вы можете изменить в своем доме, ничего не изменит. qasdfdsaq 8 лет назад 0
@qasdfdsaq Нет? При включенных коммутаторах пинг с ноутбука B по Wi-Fi на компьютер C по Ethernet не будет затронут огромными проблемами, которые могут быть вызваны тем, что устройство D проходит через маршрутизатор A в Интернет. Правильно? У всех (включая ноутбук B) могут возникнуть проблемы, как только они коснутся основного модема / маршрутизатора DSL, так как каналы забиты, но это не обязательно означает, что это только ошибка ISP или линий. Я надеюсь, что это их вина, но я не верю, что хороший пинг между двумя случайными устройствами в локальной сети обязательно означает, что проблема не в другом месте в моем доме. Phrogz 8 лет назад 0
@ Linef4ult Я редактировал вопрос со статистикой DSL. Phrogz 8 лет назад 0
Твои слова, а не мои. Я сказал, ЕСЛИ задержка в вашей сети хорошая - единственный способ узнать это - проверить каждую ссылку, включая проверку связи с маршрутизатором и модемом. Если вы этого не сделали, то не знали бы, хорошая задержка в локальной сети или нет. qasdfdsaq 8 лет назад 0

2 ответа на вопрос

2
Linef4ult

Somethings wrong. 24hr stats say:

312,600 MBytes Down 247,500 Mbytes Up

You didnt include link rates but 8A at 2KM gives you maybe a 15/5 link. At 5Mb US you could only upload around 55GB/24hrs. Even at 10Mb you wouldnt reach 250GB, so dont trust those stats.

Still, this sounds really like peer to peer/sync/malware on your network is self DOSing.

UPDATE:

You're connection is balanced like an older style ADSL connection(8D 0.5U, 12D 0.7U, 15D 1U) vs what you'd normally do with VDSL(2) (15D, 3U). This leaves you in a situation where its very easy to congest your own link.

Anything running on your network can cause an upstream queue where the modem holds a series of frames that are trying to send but are coming faster than it can forward them. So for example instead of 1ms from your laptop to modem, 20ms from modem to exchange, 5 ms from exchange to website you have: 1ms from you to modem, 100ms waiting in the frame buffer, 20ms to exchange and 5ms to site. The more thats sent, the bigger that wait time.

Things to look for: Peer to Peer (bit torrent, game launchers) Syncing apps: Windows 7/8/10 One Drive, Dropbox(esp Camera Sync), iCloud Offsite backup like Crashplan/Backblaze etc VOIP/Video call apps: Skype, TS/Mumble

Anything that sends data out to the web.

+1 Это очень хороший момент. Его использование в восходящем потоке удивительно похоже на его последующее использование, и я полагаю, что это довольно редко для большинства пользователей, если вы не делаете что-то тяжелое для загрузки, например, заполняете много торрентов или делаете большое онлайн-резервное копирование или синхронизируете или что-то еще. Spiff 8 лет назад 0
@Spiff Итак ... если предположить, что я что-то пропустил - что черные шляпы ворвались в мой дом и внедрили гнусное устройство с тяжелой загрузкой - как я могу найти / доказать, что такое устройство существует, и найти его IP и / или MAC-адрес ? (Я оставлю [поиск машины] (http://bash.org/?5273) как отдельную проблему.) Phrogz 8 лет назад 0
Ваше "что-то не так" кажется правильным. Интересно, это потому, что модем DSL находится в режиме прозрачного моста в тот момент, когда он перестал правильно записывать вещи. Сегодня вечером я сброслю его, верну ответственность за PPPoE / DHCP / NAT (вместо Airport Extreme) и посмотрю, не делает ли это статистику безумной. (Это также облегчит мне сбор статистики в то время, когда сеть находится в плохом состоянии, а не в хорошем.) Phrogz 8 лет назад 0
@Phrogz Что сказал твой провайдер? Их тесты из MTAU позволят выявить подавляющее большинство неисправностей, связанных с медью, поэтому мы можем исключить это. Linef4ult 8 лет назад 0
@ Linef4ult Я добавил обновленную статистику линий DSL в свой вопрос, а также добавил внизу то, что говорит провайдер. Они не видели никаких проблем с линией, за исключением перерасхода, который они сейчас отбросили, чтобы посмотреть, поможет ли это. Phrogz 8 лет назад 0
@Phrogz Это странно. его VDSL, но использующий профиль ADSL2 + (oldschool, bit frap). Я обновлю свой ответ сейчас. Linef4ult 8 лет назад 0
1
Spiff

Симптомы, о которых вы сообщили, звучат как проблема с буферной загрузкой, когда ваш маршрутизатор, модем DSL или DSLAM вашего интернет-провайдера буферизует слишком много пакетов, когда канал перегружен, что приводит к высокой задержке. Как правило, TCP ищет пропущенные кадры как свидетельство перегрузки и отступает. Но если ваш маршрутизатор, модем или DSLAM буферизуют вечно и никогда не позволяют сбросить кадр, вы в конечном итоге значительно увеличите время ожидания, и у TCP не будет возможности вернуться назад для устранения перегрузки. Вы никогда не должны сильно увеличивать время ожидания только потому, что ваша пропускная способность в восходящем или нисходящем направлении насыщена. Если вы это сделаете, у вас почти наверняка есть буферная шлюза.

Запустите инструмент тестирования скорости dslreports.com . В отличие от других инструментов тестирования скорости, этот инструмент также измеряет и сообщает о проблемах с буферной загрузкой, которые могут вызвать высокую задержку всякий раз, когда что-то использует всю вашу полосу пропускания в нисходящем или восходящем направлении (например, когда вы решаете передавать потоковое видео ночью).

Тот факт, что вы уже доказали, что ваши задержки увеличиваются, когда что-то использует всю пропускную способность вашей загрузки (ваш пример синхронизации iCloud Photo), является хорошим признаком того, что вы страдаете от проблем с буферной загрузкой.

Ваш модем DSL, вероятно, является источником любых проблем с восходящей буферизацией. Одним из решений может быть покупка модема DSL, о котором известно, что у него нет проблем с буферной загрузкой. Я не исследовал этот рынок, поэтому не могу помочь вам с любыми предложениями. Ваш Google-фу, вероятно, так же хорошо, как мой.

В качестве альтернативы рассмотрите возможность покупки домашнего шлюза, который может работать с CeroWrt, OpenWrt или DD-WRT, и все они теперь имеют технологии защиты от буфера, такие как FQ_CoDel, которые впервые были разработаны / разработаны в CeroWrt. Используя такой флажок, чтобы искусственно ограничить пропускную способность восходящего и нисходящего каналов до чего-то немного более медленного, чем то, на что фактически способна ваша DSL-ссылка, и наличие этого флажка фактически отбрасывает кадры и отправляет уведомления о явных перегрузках (ECN) при достижении этого предела, вместо этого Постоянная буферизация позволяет TCP обнаруживать перегрузку и откатываться так, как должен делать TCP.

Вам не обязательно отказываться от модема DSL или AirPort Extreme, чтобы установить этот * Wrt box; Вы можете установить его как проводную коробку между вашим DSL модемом и вашим первым AirPort Extreme. Просто убедитесь, что весь трафик в / из вашей домашней сети проходит через это поле. То есть убедитесь, что у вас нет подключенных к DSL-модему устройств, кроме этого * Wrt box.

Если вы знаете, что у вас есть буферное хранилище, вам, вероятно, следует устранить его, прежде чем искать другие потенциальные источники всплесков задержки, иначе это будет препятствовать вашим попыткам найти другие источники задержки.

Похоже, что это может быть на месте. См. График, добавленный внизу моего вопроса: когда сеть работала нормально, я запускал отчеты DSL, и при загрузке показывался плохой уровень буфера. Может ли эта проблема быть на стороне провайдера? Проблема началась после отключения питания и обслуживания; они могли бы решить проблему плохо? Phrogz 8 лет назад 0
@Phrogz Bufferbloat существует на устройстве, где накапливаются очереди буфера, который обычно находится в последнем блоке перед самой медленной ссылкой. Самая медленная связь обычно является вашей широкополосной связью с вашим провайдером. Таким образом, ваш буфер загрузки, вероятно, будет в вашем модеме DSL. Единственный способ, которым могло произойти отключение, - это если состояние вашей телефонной линии ухудшилось после восстановления службы, что сделало загрузку медленнее и, следовательно, облегчило перегрузку. Spiff 8 лет назад 0
Спасибо, Спифф. Ваш диагноз выглядит более вероятным. Я перенастроил сеть так, чтобы модем DSL выполнял PPPoE / NAT / DHCP (но не Wi-Fi), и перевел все другие точки доступа Wi-Fi в режим моста. Я подключил один компьютер напрямую к модему через Ethernet. Когда проблема проявилась (на этом компьютере с прямым подключением было 500 мс), я протянул кабель Ethernet к остальной части сети. Мгновенно проблема стала лучше. Так что теперь мне все еще нужно выяснить, как определить внутреннего виновника, а затем внедрить блок OpenWRT в мою сеть. Phrogz 8 лет назад 0
@Phrogz На вашем месте я бы взял небольшой полууправляемый гигабитный коммутатор, который поддерживает зеркалирование портов (например, Netgear GS105Ev2 за 40 долларов США), и подключил его между DST-модемом / шлюзом Actiontec C1000A и первым AirPort Extreme, и используйте зеркалирование портов и машину с Wireshark для захвата всего трафика, идущего в / из Интернета. Для достижения наилучших результатов сохраняйте C1000A в режиме NAT и AirPort Extreme в режиме моста во время этого теста, чтобы IP-адрес коробки преступника не скрывался за NAT AirPort Extreme. Spiff 8 лет назад 1
Понял, космонавт Спифф. Спасибо за включение конкретной модели, которая поддерживает зеркалирование. Раздражает, что для включения требуется Windows, но это небольшая цена за знание. Phrogz 8 лет назад 0
@Phrogz О, у этого нет интерфейса веб-администратора? Ну, D-Link DGS-1100-05 имеет аналогичную цену и, похоже, имеет веб-интерфейс. Есть также похожая модель TP-Link, но я не смотрел, есть ли у нее веб-интерфейс. Spiff 8 лет назад 0

Похожие вопросы