Regression and Other Stories: Beauty and Teaching Quality

Hamermesh and Parker (2005) data on student evaluations of instructors’ beauty and teaching quality for several courses at the University of Texas. See Chapter 10 in Regression and Other Stories.

Hamermesh, D. S., and Parker, A. M. (2005). Beauty in the classroom: Instructors' pulchritude and putative pedagogical productivity. Economics of Education Review, 24:369-376.

Load packages

library("rprojroot")
root<-has_file(".ROS-Examples-root")$make_fix_file()
library("rstanarm")
library("ggplot2")
library("bayesplot")
theme_set(bayesplot::theme_default(base_family = "sans"))

Load data

beauty <- read.csv(root("Beauty/data","beauty.csv"))
head(beauty)

  eval     beauty female age minority nonenglish lower course_id
1  4.3  0.2015666      1  36        1          0     0         3
2  4.5 -0.8260813      0  59        0          0     0         0
3  3.7 -0.6603327      0  51        0          0     0         4
4  4.3 -0.7663125      1  40        0          0     0         2
5  4.4  1.4214450      1  31        0          0     0         0
6  4.2  0.5002196      0  62        0          0     0         0

Do more beautiful profs get higher evaluations?

Make a scatterplot of data

par(mar=c(3,3,1,1), mgp=c(1.7, .5, 0), tck=-.01)
plot(beauty$beauty, beauty$eval)

Fit a linear regression

fit_1 <- stan_glm(eval ~ beauty, data=beauty, refresh=0)
print(fit_1, digits=2)

stan_glm
 family:       gaussian [identity]
 formula:      eval ~ beauty
 observations: 463
 predictors:   2
------
            Median MAD_SD
(Intercept) 4.01   0.03  
beauty      0.13   0.03  

Auxiliary parameter(s):
      Median MAD_SD
sigma 0.55   0.02  

------
* For help interpreting the printed output see ?print.stanreg
* For info on the priors used see ?prior_summary.stanreg

Make a scatterplot with regression lines

# Labeling the axes
plot(beauty$beauty, beauty$eval, xlab="Beauty", ylab="Average teaching evaluation")
# Display the regression line, added onto the scatterplot (add=TRUE)
coefs <- coef(fit_1)
curve(coefs[1] + coefs[2]*x, add=TRUE)
# Add dotted lines to show +/- 1 standard deviation
sigma <- sigma(fit_1)
curve(coefs[1] + coefs[2]*x + sigma, lty=2, add=TRUE)
curve(coefs[1] + coefs[2]*x - sigma, lty=2, add=TRUE)

ggplot version

ggplot(data=beauty, aes(beauty, eval)) +
  geom_point(size = 2, alpha = 0.75) +
  geom_abline(
    slope = rep(coefs[2], 3),
    intercept = c(coefs[1], coefs[1] - sigma, coefs[1] + sigma),
    linetype = c(1, 2, 2),
    color = "darkgray",
    size = 1
  ) +
  labs(
    x = "Beauty",
    y = "Average teaching evaluation"
  )

Do things differ for male and female profs?

Parallel regression lines

fit_2 <- stan_glm(eval ~ beauty + female, data=beauty, refresh=0)
print(fit_2, digits=2)

stan_glm
 family:       gaussian [identity]
 formula:      eval ~ beauty + female
 observations: 463
 predictors:   3
------
            Median MAD_SD
(Intercept)  4.09   0.03 
beauty       0.15   0.03 
female      -0.20   0.05 

Auxiliary parameter(s):
      Median MAD_SD
sigma 0.54   0.02  

------
* For help interpreting the printed output see ?print.stanreg
* For info on the priors used see ?prior_summary.stanreg

coefs2 <- coef(fit_2)

Make several subplots

# Set up a 2x2 grid of plots
par(mfrow=c(2,2))
# Make separate plot for men, ...
plot(beauty$beauty[beauty$female==0], beauty$eval[beauty$female==0], xlim=range(beauty$beauty), ylim=range(beauty$eval),
     xlab="Beauty", ylab="Average teaching evaluation", main="Men")
curve(coefs2[1] + coefs2[2]*x + coefs2[3]*0, add=TRUE)
# ... women, ...
plot(beauty$beauty[beauty$female==1], beauty$eval[beauty$female==1], xlim=range(beauty$beauty), ylim=range(beauty$eval),
      xlab="Beauty", ylab="Average teaching evaluation", main="Women")
curve(coefs2[1] + coefs2[2]*x + coefs2[3]*1, add=TRUE)
# ... and both sexes on the same plot
# First make the plot with type="n" (which displays axes but does not plot
#   the points), then plot the points and lines separately for each sex
plot(beauty$beauty, beauty$eval, xlab="Beauty", ylab="Average teaching evaluation",
      main="Both sexes", type="n")
points(beauty$beauty[beauty$female==0], beauty$eval[beauty$female==0], col="blue")
curve(coefs2[1] + coefs2[2]*x + coefs2[3]*0, add=TRUE, col="blue")
points(beauty$beauty[beauty$female==1], beauty$eval[beauty$female==1], col="red")
curve(coefs2[1] + coefs2[2]*x + coefs2[3]*1, add=TRUE, col="red")

ggplot versions

# Men 
gg_male <-
  ggplot(subset(beauty, female == 0), aes(beauty, eval)) +
  geom_point() +
  geom_abline(slope = coefs2[2], intercept = coefs2[1], color = "darkgray")
# Women
gg_female <-
  ggplot(subset(beauty, female == 1), aes(beauty, eval)) +
  geom_point() +
  geom_abline(slope = coefs2[2], intercept = coefs2[1] + coefs2[3], color = "darkgray")
# Both
gg_both <-
  ggplot(data=beauty, aes(beauty, eval)) +
  geom_point(aes(color = factor(female)), show.legend = FALSE) +
  scale_color_manual(values = c("red", "blue")) +
  geom_abline(
    slope = coefs2[2],
    intercept = c(coefs2[1], coefs2[1] + coefs2[3]),
    color = c("blue3", "red3"),
    size = 1
  )
# Put them in a grid
bayesplot_grid(
  gg_male, gg_female, gg_both,
  grid_args = list(ncol = 2),
  xlim = range(beauty$beauty),
  ylim = range(beauty$eval),
  titles = c("Men", "Women", "Both sexes")
)

Do things differ for male and female profs?

Non-parallel regression lines

fit_3 <- stan_glm(eval ~ beauty + female + beauty*female, data=beauty, refresh=0)
print(fit_3, digits=2)

stan_glm
 family:       gaussian [identity]
 formula:      eval ~ beauty + female + beauty * female
 observations: 463
 predictors:   4
------
              Median MAD_SD
(Intercept)    4.11   0.03 
beauty         0.20   0.04 
female        -0.21   0.05 
beauty:female -0.11   0.06 

Auxiliary parameter(s):
      Median MAD_SD
sigma 0.54   0.02  

------
* For help interpreting the printed output see ?print.stanreg
* For info on the priors used see ?prior_summary.stanreg

coefs3 <- coef(fit_3)

Make two subplots

# Set up a new 1x2 grid of plots
par(mfrow=c(1,2))
# Display the parallel regression lines in gray and the non-parallel lines
# in heavy black
# Make separate plot for men ...
plot(beauty$beauty[beauty$female==0], beauty$eval[beauty$female==0], xlim=range(beauty$beauty), ylim=range(beauty$eval),
      xlab="Beauty", ylab="Average teaching evaluation", main="Men")
curve(coefs2[1] + coefs2[2]*x + coefs2[3]*0,
       lwd=.5, col="gray", add=TRUE)
curve(coefs3[1] + coefs3[2]*x + coefs3[3]*0 + coefs3[4]*x*0,
       lwd=2, col="black", add=TRUE)
# ... and women
plot (beauty$beauty[beauty$female==1], beauty$eval[beauty$female==1], xlim=range(beauty$beauty), ylim=range(beauty$eval),
      xlab="Beauty", ylab="Average teaching evaluation", main="Women")
curve(coefs2[1] +coefs2[2]*x +coefs2[3]*1,
       lwd=.5, col="gray", add=TRUE)
curve(coefs3[1] + coefs3[2]*x + coefs3[3]*1 +coefs3[4]*x*1,
       lwd=2, col="black", add=TRUE)

ggplot version

# we can add to the gg_male and gg_female plots we already made above
gg_male2 <- gg_male + geom_abline(intercept = coefs3[1], slope = coefs3[2], size = 1)
gg_female2 <- gg_female + geom_abline(intercept = coefs3[1] + coefs3[3], slope = coefs3[2] + coefs3[4], size = 1)
# Put them in a grid
bayesplot_grid(
  gg_male2, gg_female2,
  grid_args = list(ncol = 2),
  xlim = range(beauty$beauty),
  ylim = range(beauty$eval),
  titles = c("Men", "Women")
)

More models

Add age

fit_4 <- stan_glm(eval ~ beauty + female + age, data=beauty, refresh=0)
print(fit_4, digits=2)

stan_glm
 family:       gaussian [identity]
 formula:      eval ~ beauty + female + age
 observations: 463
 predictors:   4
------
            Median MAD_SD
(Intercept)  4.22   0.14 
beauty       0.14   0.03 
female      -0.21   0.05 
age          0.00   0.00 

Auxiliary parameter(s):
      Median MAD_SD
sigma 0.54   0.02  

------
* For help interpreting the printed output see ?print.stanreg
* For info on the priors used see ?prior_summary.stanreg

Add minority

fit_5 <- stan_glm(eval ~ beauty + female + minority, data=beauty, refresh=0)
print(fit_5, digits=2)

stan_glm
 family:       gaussian [identity]
 formula:      eval ~ beauty + female + minority
 observations: 463
 predictors:   4
------
            Median MAD_SD
(Intercept)  4.10   0.03 
beauty       0.15   0.03 
female      -0.19   0.05 
minority    -0.10   0.07 

Auxiliary parameter(s):
      Median MAD_SD
sigma 0.54   0.02  

------
* For help interpreting the printed output see ?print.stanreg
* For info on the priors used see ?prior_summary.stanreg

Add nonenglish

fit_6 <- stan_glm(eval ~ beauty + female + nonenglish, data=beauty, refresh=0)
print(fit_6, digits=2)

stan_glm
 family:       gaussian [identity]
 formula:      eval ~ beauty + female + nonenglish
 observations: 463
 predictors:   4
------
            Median MAD_SD
(Intercept)  4.12   0.03 
beauty       0.15   0.03 
female      -0.20   0.05 
nonenglish  -0.33   0.10 

Auxiliary parameter(s):
      Median MAD_SD
sigma 0.53   0.02  

------
* For help interpreting the printed output see ?print.stanreg
* For info on the priors used see ?prior_summary.stanreg

Add nonenglish and lower

fit_7 <- stan_glm(eval ~ beauty + female + nonenglish + lower,
                  data=beauty, refresh=0)
print(fit_7, digits=2)

stan_glm
 family:       gaussian [identity]
 formula:      eval ~ beauty + female + nonenglish + lower
 observations: 463
 predictors:   5
------
            Median MAD_SD
(Intercept)  4.08   0.04 
beauty       0.15   0.03 
female      -0.19   0.05 
nonenglish  -0.31   0.11 
lower        0.09   0.05 

Auxiliary parameter(s):
      Median MAD_SD
sigma 0.53   0.02  

------
* For help interpreting the printed output see ?print.stanreg
* For info on the priors used see ?prior_summary.stanreg

Simple model with course indicators

Include course indicators in a regression

fit_8 <- stan_glm(eval ~ beauty + factor(course_id), data=beauty, refresh=0)
print(fit_8, digits=2)

stan_glm
 family:       gaussian [identity]
 formula:      eval ~ beauty + factor(course_id)
 observations: 463
 predictors:   32
------
                    Median MAD_SD
(Intercept)          4.03   0.03 
beauty               0.14   0.03 
factor(course_id)1   0.37   0.23 
factor(course_id)2   0.42   0.38 
factor(course_id)3  -0.17   0.20 
factor(course_id)4  -0.20   0.13 
factor(course_id)5   0.02   0.26 
factor(course_id)6  -0.13   0.22 
factor(course_id)7  -0.32   0.27 
factor(course_id)8  -0.14   0.38 
factor(course_id)9  -0.43   0.19 
factor(course_id)10  0.43   0.23 
factor(course_id)11 -0.08   0.37 
factor(course_id)12  0.03   0.30 
factor(course_id)13 -0.08   0.30 
factor(course_id)14 -0.52   0.30 
factor(course_id)15 -1.44   0.36 
factor(course_id)16  0.18   0.27 
factor(course_id)17  0.34   0.19 
factor(course_id)18  0.27   0.27 
factor(course_id)19 -0.31   0.22 
factor(course_id)20  0.45   0.24 
factor(course_id)21 -0.39   0.15 
factor(course_id)22 -0.29   0.16 
factor(course_id)23  0.37   0.22 
factor(course_id)24 -0.23   0.31 
factor(course_id)25 -0.14   0.31 
factor(course_id)26  0.24   0.30 
factor(course_id)27  0.13   0.37 
factor(course_id)28  0.43   0.28 
factor(course_id)29 -0.08   0.38 
factor(course_id)30  0.30   0.19 

Auxiliary parameter(s):
      Median MAD_SD
sigma 0.53   0.02  

------
* For help interpreting the printed output see ?print.stanreg
* For info on the priors used see ?prior_summary.stanreg

LS0tCnRpdGxlOiAiUmVncmVzc2lvbiBhbmQgT3RoZXIgU3RvcmllczogQmVhdXR5IGFuZCBUZWFjaGluZyBRdWFsaXR5IgphdXRob3I6ICJBbmRyZXcgR2VsbWFuLCBKZW5uaWZlciBIaWxsLCBBa2kgVmVodGFyaSIKZGF0ZTogImByIGZvcm1hdChTeXMuRGF0ZSgpKWAiCm91dHB1dDoKICBodG1sX2RvY3VtZW50OgogICAgdGhlbWU6IHJlYWRhYmxlCiAgICB0b2M6IHRydWUKICAgIHRvY19kZXB0aDogMgogICAgdG9jX2Zsb2F0OiB0cnVlCiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlCi0tLQpIYW1lcm1lc2ggYW5kIFBhcmtlciAoMjAwNSkgZGF0YSBvbiBzdHVkZW50IGV2YWx1YXRpb25zIG9mCmluc3RydWN0b3Jz4oCZIGJlYXV0eSBhbmQgdGVhY2hpbmcgcXVhbGl0eSBmb3Igc2V2ZXJhbCBjb3Vyc2VzIGF0IHRoZQpVbml2ZXJzaXR5IG9mIFRleGFzLiBTZWUgQ2hhcHRlciAxMCBpbiBSZWdyZXNzaW9uIGFuZCBPdGhlcgpTdG9yaWVzLgoKSGFtZXJtZXNoLCBELiBTLiwgYW5kIFBhcmtlciwgQS4gTS4gKDIwMDUpLiAgQmVhdXR5IGluIHRoZQpjbGFzc3Jvb206IEluc3RydWN0b3JzJyBwdWxjaHJpdHVkZSBhbmQgcHV0YXRpdmUgcGVkYWdvZ2ljYWwKcHJvZHVjdGl2aXR5LiAgRWNvbm9taWNzIG9mIEVkdWNhdGlvbiBSZXZpZXcsIDI0OjM2OS0zNzYuCgotLS0tLS0tLS0tLS0tCgoKYGBge3Igc2V0dXAsIGluY2x1ZGU9RkFMU0V9CmtuaXRyOjpvcHRzX2NodW5rJHNldChtZXNzYWdlPUZBTFNFLCBlcnJvcj1GQUxTRSwgd2FybmluZz1GQUxTRSwgY29tbWVudD1OQSkKYGBgCgojIyMjIExvYWQgcGFja2FnZXMKCmBgYHtyIH0KbGlicmFyeSgicnByb2pyb290IikKcm9vdDwtaGFzX2ZpbGUoIi5ST1MtRXhhbXBsZXMtcm9vdCIpJG1ha2VfZml4X2ZpbGUoKQpsaWJyYXJ5KCJyc3RhbmFybSIpCmxpYnJhcnkoImdncGxvdDIiKQpsaWJyYXJ5KCJiYXllc3Bsb3QiKQp0aGVtZV9zZXQoYmF5ZXNwbG90Ojp0aGVtZV9kZWZhdWx0KGJhc2VfZmFtaWx5ID0gInNhbnMiKSkKYGBgCgojIyMjIExvYWQgZGF0YQoKYGBge3IgfQpiZWF1dHkgPC0gcmVhZC5jc3Yocm9vdCgiQmVhdXR5L2RhdGEiLCJiZWF1dHkuY3N2IikpCmhlYWQoYmVhdXR5KQpgYGAKCiMjIERvIG1vcmUgYmVhdXRpZnVsIHByb2ZzIGdldCBoaWdoZXIgZXZhbHVhdGlvbnM/CgojIyMjIE1ha2UgYSBzY2F0dGVycGxvdCBvZiBkYXRhCgpgYGB7ciB9CnBhcihtYXI9YygzLDMsMSwxKSwgbWdwPWMoMS43LCAuNSwgMCksIHRjaz0tLjAxKQpwbG90KGJlYXV0eSRiZWF1dHksIGJlYXV0eSRldmFsKQpgYGAKCiMjIyMgRml0IGEgbGluZWFyIHJlZ3Jlc3Npb24KCmBgYHtyIH0KZml0XzEgPC0gc3Rhbl9nbG0oZXZhbCB+IGJlYXV0eSwgZGF0YT1iZWF1dHksIHJlZnJlc2g9MCkKcHJpbnQoZml0XzEsIGRpZ2l0cz0yKQpgYGAKCiMjIyMgTWFrZSBhIHNjYXR0ZXJwbG90IHdpdGggcmVncmVzc2lvbiBsaW5lcwoKYGBge3IgfQojIExhYmVsaW5nIHRoZSBheGVzCnBsb3QoYmVhdXR5JGJlYXV0eSwgYmVhdXR5JGV2YWwsIHhsYWI9IkJlYXV0eSIsIHlsYWI9IkF2ZXJhZ2UgdGVhY2hpbmcgZXZhbHVhdGlvbiIpCiMgRGlzcGxheSB0aGUgcmVncmVzc2lvbiBsaW5lLCBhZGRlZCBvbnRvIHRoZSBzY2F0dGVycGxvdCAoYWRkPVRSVUUpCmNvZWZzIDwtIGNvZWYoZml0XzEpCmN1cnZlKGNvZWZzWzFdICsgY29lZnNbMl0qeCwgYWRkPVRSVUUpCiMgQWRkIGRvdHRlZCBsaW5lcyB0byBzaG93ICsvLSAxIHN0YW5kYXJkIGRldmlhdGlvbgpzaWdtYSA8LSBzaWdtYShmaXRfMSkKY3VydmUoY29lZnNbMV0gKyBjb2Vmc1syXSp4ICsgc2lnbWEsIGx0eT0yLCBhZGQ9VFJVRSkKY3VydmUoY29lZnNbMV0gKyBjb2Vmc1syXSp4IC0gc2lnbWEsIGx0eT0yLCBhZGQ9VFJVRSkKYGBgCgojIyMjIGdncGxvdCB2ZXJzaW9uCgpgYGB7ciB9CmdncGxvdChkYXRhPWJlYXV0eSwgYWVzKGJlYXV0eSwgZXZhbCkpICsKICBnZW9tX3BvaW50KHNpemUgPSAyLCBhbHBoYSA9IDAuNzUpICsKICBnZW9tX2FibGluZSgKICAgIHNsb3BlID0gcmVwKGNvZWZzWzJdLCAzKSwKICAgIGludGVyY2VwdCA9IGMoY29lZnNbMV0sIGNvZWZzWzFdIC0gc2lnbWEsIGNvZWZzWzFdICsgc2lnbWEpLAogICAgbGluZXR5cGUgPSBjKDEsIDIsIDIpLAogICAgY29sb3IgPSAiZGFya2dyYXkiLAogICAgc2l6ZSA9IDEKICApICsKICBsYWJzKAogICAgeCA9ICJCZWF1dHkiLAogICAgeSA9ICJBdmVyYWdlIHRlYWNoaW5nIGV2YWx1YXRpb24iCiAgKQpgYGAKCiMjIERvIHRoaW5ncyBkaWZmZXIgZm9yIG1hbGUgYW5kIGZlbWFsZSBwcm9mcz8gIAojIyMjIFBhcmFsbGVsIHJlZ3Jlc3Npb24gbGluZXMKCmBgYHtyIH0KZml0XzIgPC0gc3Rhbl9nbG0oZXZhbCB+IGJlYXV0eSArIGZlbWFsZSwgZGF0YT1iZWF1dHksIHJlZnJlc2g9MCkKcHJpbnQoZml0XzIsIGRpZ2l0cz0yKQpjb2VmczIgPC0gY29lZihmaXRfMikKYGBgCgojIyMjIE1ha2Ugc2V2ZXJhbCBzdWJwbG90cwoKYGBge3IgfQojIFNldCB1cCBhIDJ4MiBncmlkIG9mIHBsb3RzCnBhcihtZnJvdz1jKDIsMikpCiMgTWFrZSBzZXBhcmF0ZSBwbG90IGZvciBtZW4sIC4uLgpwbG90KGJlYXV0eSRiZWF1dHlbYmVhdXR5JGZlbWFsZT09MF0sIGJlYXV0eSRldmFsW2JlYXV0eSRmZW1hbGU9PTBdLCB4bGltPXJhbmdlKGJlYXV0eSRiZWF1dHkpLCB5bGltPXJhbmdlKGJlYXV0eSRldmFsKSwKICAgICB4bGFiPSJCZWF1dHkiLCB5bGFiPSJBdmVyYWdlIHRlYWNoaW5nIGV2YWx1YXRpb24iLCBtYWluPSJNZW4iKQpjdXJ2ZShjb2VmczJbMV0gKyBjb2VmczJbMl0qeCArIGNvZWZzMlszXSowLCBhZGQ9VFJVRSkKIyAuLi4gd29tZW4sIC4uLgpwbG90KGJlYXV0eSRiZWF1dHlbYmVhdXR5JGZlbWFsZT09MV0sIGJlYXV0eSRldmFsW2JlYXV0eSRmZW1hbGU9PTFdLCB4bGltPXJhbmdlKGJlYXV0eSRiZWF1dHkpLCB5bGltPXJhbmdlKGJlYXV0eSRldmFsKSwKICAgICAgeGxhYj0iQmVhdXR5IiwgeWxhYj0iQXZlcmFnZSB0ZWFjaGluZyBldmFsdWF0aW9uIiwgbWFpbj0iV29tZW4iKQpjdXJ2ZShjb2VmczJbMV0gKyBjb2VmczJbMl0qeCArIGNvZWZzMlszXSoxLCBhZGQ9VFJVRSkKIyAuLi4gYW5kIGJvdGggc2V4ZXMgb24gdGhlIHNhbWUgcGxvdAojIEZpcnN0IG1ha2UgdGhlIHBsb3Qgd2l0aCB0eXBlPSJuIiAod2hpY2ggZGlzcGxheXMgYXhlcyBidXQgZG9lcyBub3QgcGxvdAojICAgdGhlIHBvaW50cyksIHRoZW4gcGxvdCB0aGUgcG9pbnRzIGFuZCBsaW5lcyBzZXBhcmF0ZWx5IGZvciBlYWNoIHNleApwbG90KGJlYXV0eSRiZWF1dHksIGJlYXV0eSRldmFsLCB4bGFiPSJCZWF1dHkiLCB5bGFiPSJBdmVyYWdlIHRlYWNoaW5nIGV2YWx1YXRpb24iLAogICAgICBtYWluPSJCb3RoIHNleGVzIiwgdHlwZT0ibiIpCnBvaW50cyhiZWF1dHkkYmVhdXR5W2JlYXV0eSRmZW1hbGU9PTBdLCBiZWF1dHkkZXZhbFtiZWF1dHkkZmVtYWxlPT0wXSwgY29sPSJibHVlIikKY3VydmUoY29lZnMyWzFdICsgY29lZnMyWzJdKnggKyBjb2VmczJbM10qMCwgYWRkPVRSVUUsIGNvbD0iYmx1ZSIpCnBvaW50cyhiZWF1dHkkYmVhdXR5W2JlYXV0eSRmZW1hbGU9PTFdLCBiZWF1dHkkZXZhbFtiZWF1dHkkZmVtYWxlPT0xXSwgY29sPSJyZWQiKQpjdXJ2ZShjb2VmczJbMV0gKyBjb2VmczJbMl0qeCArIGNvZWZzMlszXSoxLCBhZGQ9VFJVRSwgY29sPSJyZWQiKQpgYGAKCiMjIyMgZ2dwbG90IHZlcnNpb25zCgpgYGB7ciB9CiMgTWVuIApnZ19tYWxlIDwtCiAgZ2dwbG90KHN1YnNldChiZWF1dHksIGZlbWFsZSA9PSAwKSwgYWVzKGJlYXV0eSwgZXZhbCkpICsKICBnZW9tX3BvaW50KCkgKwogIGdlb21fYWJsaW5lKHNsb3BlID0gY29lZnMyWzJdLCBpbnRlcmNlcHQgPSBjb2VmczJbMV0sIGNvbG9yID0gImRhcmtncmF5IikKIyBXb21lbgpnZ19mZW1hbGUgPC0KICBnZ3Bsb3Qoc3Vic2V0KGJlYXV0eSwgZmVtYWxlID09IDEpLCBhZXMoYmVhdXR5LCBldmFsKSkgKwogIGdlb21fcG9pbnQoKSArCiAgZ2VvbV9hYmxpbmUoc2xvcGUgPSBjb2VmczJbMl0sIGludGVyY2VwdCA9IGNvZWZzMlsxXSArIGNvZWZzMlszXSwgY29sb3IgPSAiZGFya2dyYXkiKQojIEJvdGgKZ2dfYm90aCA8LQogIGdncGxvdChkYXRhPWJlYXV0eSwgYWVzKGJlYXV0eSwgZXZhbCkpICsKICBnZW9tX3BvaW50KGFlcyhjb2xvciA9IGZhY3RvcihmZW1hbGUpKSwgc2hvdy5sZWdlbmQgPSBGQUxTRSkgKwogIHNjYWxlX2NvbG9yX21hbnVhbCh2YWx1ZXMgPSBjKCJyZWQiLCAiYmx1ZSIpKSArCiAgZ2VvbV9hYmxpbmUoCiAgICBzbG9wZSA9IGNvZWZzMlsyXSwKICAgIGludGVyY2VwdCA9IGMoY29lZnMyWzFdLCBjb2VmczJbMV0gKyBjb2VmczJbM10pLAogICAgY29sb3IgPSBjKCJibHVlMyIsICJyZWQzIiksCiAgICBzaXplID0gMQogICkKIyBQdXQgdGhlbSBpbiBhIGdyaWQKYmF5ZXNwbG90X2dyaWQoCiAgZ2dfbWFsZSwgZ2dfZmVtYWxlLCBnZ19ib3RoLAogIGdyaWRfYXJncyA9IGxpc3QobmNvbCA9IDIpLAogIHhsaW0gPSByYW5nZShiZWF1dHkkYmVhdXR5KSwKICB5bGltID0gcmFuZ2UoYmVhdXR5JGV2YWwpLAogIHRpdGxlcyA9IGMoIk1lbiIsICJXb21lbiIsICJCb3RoIHNleGVzIikKKQpgYGAKCiMjIERvIHRoaW5ncyBkaWZmZXIgZm9yIG1hbGUgYW5kIGZlbWFsZSBwcm9mcz8gIAojIyMjIE5vbi1wYXJhbGxlbCByZWdyZXNzaW9uIGxpbmVzCgpgYGB7ciB9CmZpdF8zIDwtIHN0YW5fZ2xtKGV2YWwgfiBiZWF1dHkgKyBmZW1hbGUgKyBiZWF1dHkqZmVtYWxlLCBkYXRhPWJlYXV0eSwgcmVmcmVzaD0wKQpwcmludChmaXRfMywgZGlnaXRzPTIpCmNvZWZzMyA8LSBjb2VmKGZpdF8zKQpgYGAKCiMjIyMgTWFrZSB0d28gc3VicGxvdHMKCmBgYHtyIH0KIyBTZXQgdXAgYSBuZXcgMXgyIGdyaWQgb2YgcGxvdHMKcGFyKG1mcm93PWMoMSwyKSkKIyBEaXNwbGF5IHRoZSBwYXJhbGxlbCByZWdyZXNzaW9uIGxpbmVzIGluIGdyYXkgYW5kIHRoZSBub24tcGFyYWxsZWwgbGluZXMKIyBpbiBoZWF2eSBibGFjawojIE1ha2Ugc2VwYXJhdGUgcGxvdCBmb3IgbWVuIC4uLgpwbG90KGJlYXV0eSRiZWF1dHlbYmVhdXR5JGZlbWFsZT09MF0sIGJlYXV0eSRldmFsW2JlYXV0eSRmZW1hbGU9PTBdLCB4bGltPXJhbmdlKGJlYXV0eSRiZWF1dHkpLCB5bGltPXJhbmdlKGJlYXV0eSRldmFsKSwKICAgICAgeGxhYj0iQmVhdXR5IiwgeWxhYj0iQXZlcmFnZSB0ZWFjaGluZyBldmFsdWF0aW9uIiwgbWFpbj0iTWVuIikKY3VydmUoY29lZnMyWzFdICsgY29lZnMyWzJdKnggKyBjb2VmczJbM10qMCwKICAgICAgIGx3ZD0uNSwgY29sPSJncmF5IiwgYWRkPVRSVUUpCmN1cnZlKGNvZWZzM1sxXSArIGNvZWZzM1syXSp4ICsgY29lZnMzWzNdKjAgKyBjb2VmczNbNF0qeCowLAogICAgICAgbHdkPTIsIGNvbD0iYmxhY2siLCBhZGQ9VFJVRSkKIyAuLi4gYW5kIHdvbWVuCnBsb3QgKGJlYXV0eSRiZWF1dHlbYmVhdXR5JGZlbWFsZT09MV0sIGJlYXV0eSRldmFsW2JlYXV0eSRmZW1hbGU9PTFdLCB4bGltPXJhbmdlKGJlYXV0eSRiZWF1dHkpLCB5bGltPXJhbmdlKGJlYXV0eSRldmFsKSwKICAgICAgeGxhYj0iQmVhdXR5IiwgeWxhYj0iQXZlcmFnZSB0ZWFjaGluZyBldmFsdWF0aW9uIiwgbWFpbj0iV29tZW4iKQpjdXJ2ZShjb2VmczJbMV0gK2NvZWZzMlsyXSp4ICtjb2VmczJbM10qMSwKICAgICAgIGx3ZD0uNSwgY29sPSJncmF5IiwgYWRkPVRSVUUpCmN1cnZlKGNvZWZzM1sxXSArIGNvZWZzM1syXSp4ICsgY29lZnMzWzNdKjEgK2NvZWZzM1s0XSp4KjEsCiAgICAgICBsd2Q9MiwgY29sPSJibGFjayIsIGFkZD1UUlVFKQpgYGAKCiMjIyMgZ2dwbG90IHZlcnNpb24KCmBgYHtyIH0KIyB3ZSBjYW4gYWRkIHRvIHRoZSBnZ19tYWxlIGFuZCBnZ19mZW1hbGUgcGxvdHMgd2UgYWxyZWFkeSBtYWRlIGFib3ZlCmdnX21hbGUyIDwtIGdnX21hbGUgKyBnZW9tX2FibGluZShpbnRlcmNlcHQgPSBjb2VmczNbMV0sIHNsb3BlID0gY29lZnMzWzJdLCBzaXplID0gMSkKZ2dfZmVtYWxlMiA8LSBnZ19mZW1hbGUgKyBnZW9tX2FibGluZShpbnRlcmNlcHQgPSBjb2VmczNbMV0gKyBjb2VmczNbM10sIHNsb3BlID0gY29lZnMzWzJdICsgY29lZnMzWzRdLCBzaXplID0gMSkKIyBQdXQgdGhlbSBpbiBhIGdyaWQKYmF5ZXNwbG90X2dyaWQoCiAgZ2dfbWFsZTIsIGdnX2ZlbWFsZTIsCiAgZ3JpZF9hcmdzID0gbGlzdChuY29sID0gMiksCiAgeGxpbSA9IHJhbmdlKGJlYXV0eSRiZWF1dHkpLAogIHlsaW0gPSByYW5nZShiZWF1dHkkZXZhbCksCiAgdGl0bGVzID0gYygiTWVuIiwgIldvbWVuIikKKQpgYGAKCiMjIE1vcmUgbW9kZWxzCiMjIyMgQWRkIGFnZQoKYGBge3IgfQpmaXRfNCA8LSBzdGFuX2dsbShldmFsIH4gYmVhdXR5ICsgZmVtYWxlICsgYWdlLCBkYXRhPWJlYXV0eSwgcmVmcmVzaD0wKQpwcmludChmaXRfNCwgZGlnaXRzPTIpCmBgYAoKIyMjIyBBZGQgbWlub3JpdHkKCmBgYHtyIH0KZml0XzUgPC0gc3Rhbl9nbG0oZXZhbCB+IGJlYXV0eSArIGZlbWFsZSArIG1pbm9yaXR5LCBkYXRhPWJlYXV0eSwgcmVmcmVzaD0wKQpwcmludChmaXRfNSwgZGlnaXRzPTIpCmBgYAoKIyMjIyBBZGQgbm9uZW5nbGlzaAoKYGBge3IgfQpmaXRfNiA8LSBzdGFuX2dsbShldmFsIH4gYmVhdXR5ICsgZmVtYWxlICsgbm9uZW5nbGlzaCwgZGF0YT1iZWF1dHksIHJlZnJlc2g9MCkKcHJpbnQoZml0XzYsIGRpZ2l0cz0yKQpgYGAKCiMjIyMgQWRkIG5vbmVuZ2xpc2ggYW5kIGxvd2VyCgpgYGB7ciB9CmZpdF83IDwtIHN0YW5fZ2xtKGV2YWwgfiBiZWF1dHkgKyBmZW1hbGUgKyBub25lbmdsaXNoICsgbG93ZXIsCiAgICAgICAgICAgICAgICAgIGRhdGE9YmVhdXR5LCByZWZyZXNoPTApCnByaW50KGZpdF83LCBkaWdpdHM9MikKYGBgCgojIyBTaW1wbGUgbW9kZWwgd2l0aCBjb3Vyc2UgaW5kaWNhdG9ycwojIyMjIEluY2x1ZGUgY291cnNlIGluZGljYXRvcnMgaW4gYSByZWdyZXNzaW9uCgpgYGB7ciB9CmZpdF84IDwtIHN0YW5fZ2xtKGV2YWwgfiBiZWF1dHkgKyBmYWN0b3IoY291cnNlX2lkKSwgZGF0YT1iZWF1dHksIHJlZnJlc2g9MCkKcHJpbnQoZml0XzgsIGRpZ2l0cz0yKQpgYGAKCg==

Regression and Other Stories: Beauty and Teaching Quality

Andrew Gelman, Jennifer Hill, Aki Vehtari

2020-08-22

Load packages

Load data

Do more beautiful profs get higher evaluations?

Make a scatterplot of data

Fit a linear regression

Make a scatterplot with regression lines

ggplot version

Do things differ for male and female profs?

Parallel regression lines

Make several subplots

ggplot versions

Do things differ for male and female profs?

Non-parallel regression lines

Make two subplots

ggplot version

More models

Add age

Add minority

Add nonenglish

Add nonenglish and lower

Simple model with course indicators

Include course indicators in a regression