Статистическое тестирование переменных шага

391
wonea

У меня есть три переменные, которые я хотел бы проанализировать. Два из них являются значениями шага - один набор значений 1-6, а другой диапазон 1-5. Третья переменная не является шагом, но может иметь относительно широкий диапазон возможных значений. Я пытаюсь определить, связана ли моя третья переменная с одним из двух значений шага.

Значения шага представляют различные уровни оплаты и ранжирования, в то время как неэтапная переменная представляет оплату. Как я могу проверить, связана ли оплата с оценкой и / или рейтингом заработной платы? И есть ли способ отобразить все три переменные на одном графике?

1
Почему это было перенесено с SO? J. Polfer 14 лет назад 0

3 ответа на вопрос

1
Henry Troup

Должна быть возможность построить график с помощью трехмерного графика поверхности или «графа леса» - две ступенчатые функции определяют плоскость, а нешаговое значение представляет собой высоту.

Чтобы проанализировать корреляцию, я бы определил объединенную пошаговую функцию для тридцати ячеек, определенных плоскостью двух существующих ступенчатых функций.

0
JDB

JHC - R Statistical - это пакет статистики с открытым исходным кодом, который работает на всех основных платформах ( http://www.r-project.org/ ) и выполняет очень хорошую работу по анализу. В следующем примере кода будут собраны скопированные данные (столбцы «Ранг», «Оценка» и «Оплата») и дан анализ, который вы ищете.

mydata <- read.table ("clipboard", header = TRUE);

ответ = MYDATA $ Pay ~ MYDATA $ Ранг + MYDATA $ Grade;

участок (ответ);

коплот (Ранг ~ Оценка | Оплата, данные = mydata);

приспособленный = ле (ответ);

afit = ANOVA (подходит);

afit;

участок (подходит);

кор (MYDATA $ Rank, MYDATA $ Grade)

(для более подробной информации - ищите справку, используя следующие команды :) help (lm); помощь (ANOVA); помощь (coplot);

0

Извините, JDB - я попробовал R, и я просто не понимаю этого. Я не могу заставить R читать мои данные (черт возьми, я даже не могу понять, где R хочет, чтобы я поместил данные).

Из того, что я вижу в примере кода, хотя. вы предлагаете использовать тест ANOVA? Есть ли какая-то причина, по которой функция cor смотрит только на ранги и оценки?

@ user11629: read.table ("clipboard") будет считывать данные из буфера обмена в Windows (вы должны были скопировать данные из другой программы / текстового редактора / и т. д.). Что касается функции cor - простая корреляция выглядит только на две переменные. cor (mydata $ Rank, mydata $ Grade) также может быть cor (mydata $ Rank, mydata $ Pay) или cor (mydata $ Pay, mydata $ Grade). Так как вопрос был о графике этих переменных и определении корреляций, это сделало бы работу. Тем не менее, первоначальный спрашивающий должен учитывать статистику этих анализов. JDB 13 лет назад 0