1 Distribuição Exponencial

A função densidade de probabilidade associada a variável aleatória tempo até o evento \(t\) com distribuição exponencial e função de sobrevivência é dada por:

\[ f(t) = \frac{1}{\alpha} \cdot exp\left[-\frac{t}{\alpha}\right] \ ; \ S(t)= exp\left[-\frac{t}{\alpha}\right]\ t > 0 \]

Como o parâmetro \(\alpha > 0\) correspondendo ao tempo médio de vida.

1.1 Função de verossimilhança

\[ L(\theta | t) = \prod_{i=1}^{n} \left[\left(\frac{1}{\alpha} \cdot exp\left[-\frac{t}{\alpha}\right] \right)^{\delta_{i}} \cdot \left(exp\left[-\frac{t}{\alpha}\right]\right)^{1-\delta_{i}}\right] \]

\[ = \prod_{i=1}^{n} \left[ \left( \frac{1}{\alpha} \right)^{\delta_{i}} \cdot \exp \left[ -\left( \frac{t_{i}}{\alpha} \right) \right]\right] \]

1.2 A Log-verossimilhança da exponencial

\[ \ell[L(\theta | t)] = \sum_{i=1}^n \left[ - \delta_i \log(\alpha) - \left( \frac{t_i}{\alpha} \right) \right] \]

Derivando em relação a \(\alpha\) teremos que:

\[ \frac{\partial l[L(\hat{\theta}|t_{i})]}{\partial\alpha} = \frac{-\sum_{i=1}^{n}\cdot\delta_{i}}{\alpha} + \frac{\sum_{i=1}^{n}t_{i}}{\alpha^{2}} = 0 \]

\[ \frac{-\sum_{i=1}^{n}\cdot\delta_{i}}{\alpha} + \frac{\sum_{i=1}^{n}t_{i}}{\alpha^{2}} = 0 \ \cdot (\alpha^{2}) \]

\[ = -\sum_{i=1}^{n}\cdot\delta_{i}\cdot \alpha + \sum_{i=1}^{n}t_{i} = 0 \]

\[ \sum_{i=1}^{n} t_{i} = \sum_{i=1}^{n} \cdot \delta_{i} \cdot \alpha \]

\[ \hat{\alpha} = \frac{\sum_{i=1}^{n}t_{i}}{\sum_{i=1}^{n}\cdot\delta_{i}} \]

Na ausência de censura, aplicando \(\delta_{i}={1}\), teremos:

\[ \hat{\alpha} = \frac{\sum_{i=1}^{n}t_{i}}{n} \]

Que é exatamente a média amostral de \(t_{i}\).

1.3 Sobre o modelo

O modelo mais simples, caracterizado pela ausência de memória. Sendo aplicado em situações onde a falha ocorre de forma aleatória e estável, limitado para casos em que se quer obter o envelhecimento ou desgaste.

1.4 Linearização da função de sobrevivência

“Para comparar o comportamento do modelo com os dados utilizados, se pode aplicar a linearização da função de sobrevivência de cada modelo construindo gráficos que sejam aproximadamente lineares, caso o modelo seja apropiado. Violação de lienaridade pode ser verificada visualmente de forma rápida.”

1.4.1 Linearização da função de sobrevivência exponencial

Para o modelo exponencial, a função de sobre vivência é dada por

\[ S(t)= exp\left[-\frac{t}{\alpha}\right] \]

Logo,

\[-\log[S(t)] = \frac{t}{\alpha} = \left(\frac{1}{\alpha}\right)t\]

corresponde à equação da reta \(y = a+bx\), \(y=-log[S(t)]\), \(a=0\), \(b=1/\alpha\) e \(x= t\). Sendo o modelo apropriado no caso \(y\) versus t deve aproximadamente linear passando pela origem, com \(\hat{S}(t)\) correspodendo ao estimador de Kaplan-Meier.

1.5 Aplicação: pacientes com câncer de bexiga

1º Função log-verossimilhança encontrado

log_vero_surv_exponencial <- function(theta, t, status) {
  alpha <- theta[1]
  
  if(alpha <= 0) return(Inf)
  
  logv <- sum(-status * log(alpha) -(t/alpha))
  
  # Log-verossimilhança total (negativa para o optim)
  return(-logv)
}

2º Estimador de Kaplan-Meier

Dado por:

\[ \hat{S}(t)= \prod_{t_{j}\leq t} \left(1 - \frac{d_{j}}{n_{j}}\right) \]

ekm <- function(tempos,status){
  ordem <- order(tempos)
  t <- tempos[ordem]
  s <- status[ordem]
  
  n <- length(t)
  surv <- numeric(n)
  p_surv <- 1
  
  for(i in 1:n) {
    n_risco <- n - i + 1
    if(s[i] == 1) {
      p_surv <- p_surv * ((n_risco - 1) / n_risco)
    }
    surv[i] <- p_surv
  }
  
  return(list(tempo = t, sobrevivencia = surv))
}

3º Aplicando o pacote \(optim\) para estimar \(\hat{\alpha}\)

ajus11 <- optim(par = 1,
                fn=log_vero_surv_exponencial, 
                t = tempos,
                status = cens, 
                method="Brent",#para um parâmetro
                lower = 0.001,
                upper = 1000)

O valor \(\hat{\alpha}\) é de 20.41177 sendo o valor da estatistica da log-verrossimilhança para o modelo de 68.27389.

4º Obtendo o valor de \(\hat{\alpha}\), se pode verificar graficamente a curva de sobrevivência teórica à curva de Kaplan-Meier.

t_teorico <- seq(0, max(tempos),length.out=50)
s_teorico <- exp(-t_teorico/ajus11$par)

5º E pela linearidade, se pode observar o comportamento dos dados ao modelo.

risco_acumulado_km <- -log(km_c_bx$sobrevivencia)

No gráfico de verificação de risco ou linearidade, se observa o risco acumulado versus o tempo. Se o risco fosse constante para o modelo Exponencial, os pontos deveriam formar uma linha reta partindo da origem. No caso, entretanto, os pontos formam uma curva para cima, indicando que o risco de o evento ocorrer aumenta com o tempo (risco de reincidência do tumor). No início, o risco é vagaroso (tempo 0 a 15 meses), após o tempo 20, a inclinação aumenta bruscamente.