log_vero_surv_exponencial <- function(theta, t, status) {
alpha <- theta[1]
if(alpha <= 0) return(Inf)
logv <- sum(-status * log(alpha) -(t/alpha))
# Log-verossimilhança total (negativa para o optim)
return(-logv)
}1 Distribuição Exponencial
A função densidade de probabilidade associada a variável aleatória tempo até o evento \(t\) com distribuição exponencial e função de sobrevivência é dada por:
\[ f(t) = \frac{1}{\alpha} \cdot exp\left[-\frac{t}{\alpha}\right] \ ; \ S(t)= exp\left[-\frac{t}{\alpha}\right]\ t > 0 \]
Como o parâmetro \(\alpha > 0\) correspondendo ao tempo médio de vida.
1.1 Função de verossimilhança
\[ L(\theta | t) = \prod_{i=1}^{n} \left[\left(\frac{1}{\alpha} \cdot exp\left[-\frac{t}{\alpha}\right] \right)^{\delta_{i}} \cdot \left(exp\left[-\frac{t}{\alpha}\right]\right)^{1-\delta_{i}}\right] \]
\[ = \prod_{i=1}^{n} \left[ \left( \frac{1}{\alpha} \right)^{\delta_{i}} \cdot \exp \left[ -\left( \frac{t_{i}}{\alpha} \right) \right]\right] \]
1.2 A Log-verossimilhança da exponencial
\[ \ell[L(\theta | t)] = \sum_{i=1}^n \left[ - \delta_i \log(\alpha) - \left( \frac{t_i}{\alpha} \right) \right] \]
Derivando em relação a \(\alpha\) teremos que:
\[ \frac{\partial l[L(\hat{\theta}|t_{i})]}{\partial\alpha} = \frac{-\sum_{i=1}^{n}\cdot\delta_{i}}{\alpha} + \frac{\sum_{i=1}^{n}t_{i}}{\alpha^{2}} = 0 \]
\[ \frac{-\sum_{i=1}^{n}\cdot\delta_{i}}{\alpha} + \frac{\sum_{i=1}^{n}t_{i}}{\alpha^{2}} = 0 \ \cdot (\alpha^{2}) \]
\[ = -\sum_{i=1}^{n}\cdot\delta_{i}\cdot \alpha + \sum_{i=1}^{n}t_{i} = 0 \]
\[ \sum_{i=1}^{n} t_{i} = \sum_{i=1}^{n} \cdot \delta_{i} \cdot \alpha \]
\[ \hat{\alpha} = \frac{\sum_{i=1}^{n}t_{i}}{\sum_{i=1}^{n}\cdot\delta_{i}} \]
Na ausência de censura, aplicando \(\delta_{i}={1}\), teremos:
\[ \hat{\alpha} = \frac{\sum_{i=1}^{n}t_{i}}{n} \]
Que é exatamente a média amostral de \(t_{i}\).
1.3 Sobre o modelo
O modelo mais simples, caracterizado pela ausência de memória. Sendo aplicado em situações onde a falha ocorre de forma aleatória e estável, limitado para casos em que se quer obter o envelhecimento ou desgaste.
1.4 Linearização da função de sobrevivência
“Para comparar o comportamento do modelo com os dados utilizados, se pode aplicar a linearização da função de sobrevivência de cada modelo construindo gráficos que sejam aproximadamente lineares, caso o modelo seja apropiado. Violação de lienaridade pode ser verificada visualmente de forma rápida.”
1.4.1 Linearização da função de sobrevivência exponencial
Para o modelo exponencial, a função de sobre vivência é dada por
\[ S(t)= exp\left[-\frac{t}{\alpha}\right] \]
Logo,
\[-\log[S(t)] = \frac{t}{\alpha} = \left(\frac{1}{\alpha}\right)t\]
corresponde à equação da reta \(y = a+bx\), \(y=-log[S(t)]\), \(a=0\), \(b=1/\alpha\) e \(x= t\). Sendo o modelo apropriado no caso \(y\) versus t deve aproximadamente linear passando pela origem, com \(\hat{S}(t)\) correspodendo ao estimador de Kaplan-Meier.
1.5 Aplicação: pacientes com câncer de bexiga
1º Função log-verossimilhança encontrado
2º Estimador de Kaplan-Meier
Dado por:
\[ \hat{S}(t)= \prod_{t_{j}\leq t} \left(1 - \frac{d_{j}}{n_{j}}\right) \]
ekm <- function(tempos,status){
ordem <- order(tempos)
t <- tempos[ordem]
s <- status[ordem]
n <- length(t)
surv <- numeric(n)
p_surv <- 1
for(i in 1:n) {
n_risco <- n - i + 1
if(s[i] == 1) {
p_surv <- p_surv * ((n_risco - 1) / n_risco)
}
surv[i] <- p_surv
}
return(list(tempo = t, sobrevivencia = surv))
}3º Aplicando o pacote \(optim\) para estimar \(\hat{\alpha}\)
ajus11 <- optim(par = 1,
fn=log_vero_surv_exponencial,
t = tempos,
status = cens,
method="Brent",#para um parâmetro
lower = 0.001,
upper = 1000)O valor \(\hat{\alpha}\) é de 20.41177 sendo o valor da estatistica da log-verrossimilhança para o modelo de 68.27389.
4º Obtendo o valor de \(\hat{\alpha}\), se pode verificar graficamente a curva de sobrevivência teórica à curva de Kaplan-Meier.
t_teorico <- seq(0, max(tempos),length.out=50)
s_teorico <- exp(-t_teorico/ajus11$par)
5º E pela linearidade, se pode observar o comportamento dos dados ao modelo.
risco_acumulado_km <- -log(km_c_bx$sobrevivencia)
No gráfico de verificação de risco ou linearidade, se observa o risco acumulado versus o tempo. Se o risco fosse constante para o modelo Exponencial, os pontos deveriam formar uma linha reta partindo da origem. No caso, entretanto, os pontos formam uma curva para cima, indicando que o risco de o evento ocorrer aumenta com o tempo (risco de reincidência do tumor). No início, o risco é vagaroso (tempo 0 a 15 meses), após o tempo 20, a inclinação aumenta bruscamente.