El problema nos habla de un grupo de conductores entre los cuales hay conductores de 3 tipos: de bajo riesgo, de riesgo moderado y de alto riesgo. Entonces es natural modelar el problema con una distribución multinomial.

Sean $X, Y, Z$ el número de conductores de bajo riesgo, de riesgo moderado y de alto riesgo en el grupo seleccionado, respectivamente.

Notemos que $X, Y \text{ y } Z$ son variables aleatorias, pues no sabemos cuántos condutores de cada tipo habrá en el grupo de 4 conductores seleccionado.

Como el grupo seleccionado es de 4 conductores, los posibles valores para $X, Y \text{ y } Z$ (es decir, sus soportes) son:

Por ejemplo, si de los 4 conductores seleccionados hay 2 de bajo riesgo, $X=2$, y dos de riesgo moderado, $Y = 2$, entonces debe haber 0 de alto riesgo, $Z=0$.

Es decir, se debe cumplir que $X+Y+Z=4$.

Como ya se mencionó, el modelo apropiado para este problema es multinomial con $n = 4$:

$$ f_{X,Y,Z}(x,y,z) = \mathbb{P}(X=x, Y=y, Z=z) = \frac{n!}{x!y!z!}p_1 ^x p_2 ^y p_3 ^z $$

<aside> 💡 Esto ocurre porque podemos imaginarnos que dentro de un grupo de muchas personas extraemos exactamente un grupo de 4 personas. Es decir, es análogo al problema de sacar objetos diferentes de una caja.

</aside>

Además conocemos quiénes son $p_1, p_2 \text{ y } p_3$, pues por hipótesis sabemos que de entre todos los conductores interesados en sacar su primer permiso para conducir, el $50\%$ es de bajo riesgo, el $30\%$ es de riesgo moderado y el $20\%$ es de alto riesgo, es decir:

Por otro lado, nos interesa calcular la probabilidad de que en el grupo de 4 personas haya al menos dos conductores de alto riesgo más que los de bajo riesgo, es decir, nos interesa

$$ \mathbb{P}(Z\geq X+2) $$

Eso ocurre si y solo si

$$ (x,y,z) \in \{(0,0,4), (1,0,3), (0,1,3), (0,2,2) \} $$