Новый компьютер не может работать под Linux, но без проблем работает под Windows

2086
nobar

У меня новый игровой ноутбук, который вылетает каждый раз, когда я запускаю Linux. Если я запускаю Linux изначально, он полностью зависает (включая курсор мыши) после, казалось бы, случайного периода. Если я запускаю Linux в VMWare Player под Windows 8.1, Linux в конечном итоге зависает точно так же, но Windows также аварийно завершает работу и отображает синий экран смерти (BSOD) после небольшой задержки. BSOD всегда говорит MACHINE_CHECK_EXCEPTION, а журнал BugCheck указывает код 0x9c.

Варианты Linux, которые я попробовал:

  • Ubuntu MATE 15.10 64-bit
  • Ubuntu 15.04 64-bit
  • Ubuntu MATE 15.04 64-bit
  • Ubuntu MATE 14.04.2 64-разрядная версия
  • Ubuntu MATE 14.04.2 32-разрядная версия

Кроме этих более или менее случайных зависаний, Linux работает нормально - и я могу использовать его в течение многих часов между сбоями.

Я предполагал, что это аппаратная проблема, но проблема в том, что я не могу заставить Windows аварийно завершить работу, если я также не использую Linux (в ВМ). Я пытался одновременно запускать все доступные приложения (около 30), одновременно проигрывая видео с YouTube, а также запускать приложения для стресс-тестирования, такие как Prime95 . Я также сделал несколько игр с большим количеством графики.

Я запустил «Средство диагностики памяти Windows» и другие тесты памяти без видимых проблем.

Можно предположить, что Linux каким-то образом использует функции процессора, которые Windows не использует, но неясно, почему это может вызвать случайные сбои оборудования.

Как я могу окончательно доказать, что у меня неисправное оборудование (или нет)?


РЕДАКТИРОВАТЬ: Кажется, мне немного повезло, исправляя проблемы с Linux, отключив некоторые функции в BIOS. С тех пор я не видел сбоев. Изменения, которые я сделал изначально (только на основе догадок):

  • Технология виртуализации: отключена
  • Быстрая загрузка: отключено
  • SpeedStep: отключено
  • Таймер задержки PCI: 64 такта (было 32)

Основываясь на последующем тестировании их вариантов, очевидно, что и VT, и SS должны быть отключены, но наверняка, по крайней мере, SpeedStep. Это облегчает изоляцию сбоев как основанную на аппаратном дефекте? ... Или это может быть программная проблема в Ubuntu / Linux?


Чтобы сделать мой вопрос более четким: я на самом деле не спрашиваю пути решения проблемы, хотя это было бы здорово в теории. Что мне действительно нужно, так это способ изолировать и воспроизвести эту проблему под Windows без использования Linux. Я работаю с предположением, что у меня плохой юнит, и мне просто нужен способ доказать это. Помните, что когда я запускаю Linux, машина выходит из строя (исключая изменения BIOS, упомянутые выше), поэтому это не может быть решено простым обновлением драйверов Windows.

Короче говоря: зная, что Linux вызывает сбои, есть ли какой-нибудь другой стресс-тест, который я могу запустить в Windows, который может вызвать тот же тип сбоев? Или это известная ошибка в Linux?

Обратите внимание, что мой процессор - новый i7-5700HQ ( микроархитектура Broadwell ).

Также обратите внимание: я не верю, что это вызвано сильным перегревом. Машина оснащена дополнительным вентилятором, который можно включить вручную, и сбои, похоже, не связаны с большими нагрузками.


ОБНОВЛЕНИЕ: проблемы с естественным запуском Linux были решены путем установки обновления BIOS, которое стало доступно через несколько месяцев после того, как я опубликовал вопрос. Я также сейчас использую Ubuntu MATE 15.10, но я не думаю, что это имеет значение, так как это также не удалось до обновления BIOS. Я думаю, что в общем и целом, система не была совместима с Linux (или наоборот), как это было на момент выпуска.

Я не возвращался и не проверял проблему с виртуальной машиной, так как теперь мне это не нужно, поскольку я могу работать с Linux на родном языке, а также перешел с Windows 8.1 на Windows 10, так что это точно не яблоки. тест на яблоки в любом случае.

3
Хорошо, теперь я проверил (и разбился) с ванильной Ubuntu 15.04. nobar 8 лет назад 0
Что за машина? Journeyman Geek 8 лет назад 0
@JourneymanGeek: MSI GE72 APACHE PRO-077 nobar 8 лет назад 0
Очень похожая ситуация была обнаружена при поиске с помощью [linux broadwell speedstep] (https://www.google.com/search?q=linux+broadwell+speedstep): [Работа вокруг проблемы стабильности процессора Intel Core i7 5775C в Linux] (http : //www.phoronix.com/scan.php страница = news_item & ПВ = ядро-i7-5775c-ос-фиксированный режим). Указанный обходной путь, по-видимому, относится к отключению «понижающей тактовой частоты» в BIOS. nobar 8 лет назад 1
Тот же ноутбук с теми же ошибками. Это работает для вас в конце концов? Люди все еще имеют ошибки здесь: http://ubuntuforums.org/showthread.php?t=2284315&page=2 gabrielhpugliese 8 лет назад 0
@gabrielhpugliese: Спасибо за ссылку. Я все еще думаю, что исправления, которые я опубликовал, работают, но я запускаю Windows на этом компьютере последние пару месяцев, поэтому у меня нет никаких новых данных - кроме наблюдения, что Windows по-прежнему не падает. nobar 8 лет назад 0
Я использую Virtualbox для запуска Ubuntu 14.04.1 с вашими советами (виртуализация включена, FastBoot отключена, SpeedStep отключена и таймер задержки PCI 64). Пока все хорошо, я буду держать ссылку обновленной. gabrielhpugliese 8 лет назад 0
Первые результаты показывают * все лучше * (с включенным SpeedStep) на 64-битной Ubuntu MATE 15.10. Скрещенные пальцы... nobar 8 лет назад 0
Мой предыдущий комментарий оказался ложным - он все еще терпел неудачу, по крайней мере, в некоторых сложных сценариях использования. Я только что обнаружил, что доступен новый BIOS, поэтому я только что обновил MicroCode с 0xd до 0x13. После этого я сдаю тест, который ранее не удался ... nobar 8 лет назад 0

3 ответа на вопрос

1
Divin3

This is a hardware issue, 9C the parameters have different meanings depending on what type of CPU you have. Most commonly it results from overheating, from failed hardware - CPU, RAM, power supply, etc. Pushing hardware beyond its capabilities such as overclocking can cause that error too.

Check the hardware settings in your bios, starting with the RAM. Ensure there's no overheating nor overclocking.

Also try to uninstall/not to install programs that came with your motherboard.


If this does not solve the problem, You should try a few more steps:

  1. Ensure that the machine is adequately cooled. If there is any doubt, open up the side of the PC case -if possible- (be mindful of any relevant warranty conditions!) and point a mains fan squarely at the motherboard. That will rule out most (lack of) cooling issues.

  2. Update all hardware-related drivers: video, sound, RAID (if any), NIC... anything that interacts with a piece of hardware. It is good practice to run the latest drivers anyway.

  3. Update the motherboard BIOS according to the manufacturer's instructions. Their website should provide detailed instructions as to the brand and model-specific procedure.

  4. Attempt to (stress) test those hardware components which can be put through their paces artificially. The most obvious examples are the RAM and HDD(s). For the RAM, use the in-built memory diagnostics (run MDSCHED) or the 3rd-party memtest86 utility to run many hours worth of testing. For hard drives, check whether CHKDSK /R finds any problems on the drive(s), notably "bad sectors". Unreliable RAM, in particular, is deadly as far as software is concerned, and anything other than a 100% clear memory test result is cause for concern. Unfortunately, even a 100% clear result from the diagnostics utilities does not guarantee that the RAM is free from defects - only that none were encountered during the test passes.

  5. Clean and carefully remove any dust from the inside of the machine. Reseat all connectors and memory modules. Use a can of compressed air to clean out the RAM DIMM sockets as much as possible.

  6. If all else fails, start removing items of hardware one-by-one in the hope that the culprit is something non-essential which can be removed. Obviously, this type of testing is a lot easier if you've got access to equivalent components in order to perform swaps. In your case, the RAM and HDD probably can be swapped.

@nobar - Так как дела? Проблема все еще сохраняется? Если да, оставьте комментарий, и я проведу дополнительное исследование. Если это решено и было решено моим ответом, Вы можете принять это как ответ. Если Вы решили это другим способом, то Вам следует ответить на свой вопрос. Divin3 8 лет назад 0
1
Ramsez

добавьте libata.force = noncq в параметр загрузки grub. Работает как шарм. Моя проблема заключается в видеодрайверах, не работающих в виртуальной машине, а на самом деле двойной загрузки.

1
nobar

From service.msicomputer.com:

Why do I get a BSOD MACHINE_CHECK_EXCEPTION?

If you are experiencing a blue screen error when opening any Office 2016 applications, certain games, and virtual desktop Software, showing a "MACHINE_CHECK_EXCEPTION" or "CLOCK_WATCHDOG_TIMEOUT" BSOD's. This is caused by bug in the Microcode affecting only Broadwell CPU's (5th Gen) and it is resolved by updating the Microcode via a BIOS update from the versions listed below.

...

Last Update: September 30th, 2015

Оно работает. Примечание: «Выбор режима загрузки» должен быть изменен с «UEFI» на «LEGACY». SandroMarques 8 лет назад 0

Похожие вопросы