Postagens

Métricas Quantitativas que Realmente Importam em uma EA no MT5

 Muita gente olha apenas o lucro líquido de uma EA no MT5. O relatório de performance possui métricas mais importantes que o lucro isolado. Glossário básico de métricas quantitativas: PF (Profit Factor) Lucro bruto dividido pela perda bruta. PF > 1 = sistema lucrativo PF < 1 = sistema perdedor Sharpe Ratio Retorno ajustado pela volatilidade da curva. Sharpe alto indica: maior estabilidade menor serrilhado melhor consistência estatística Drawdown (DD) Maior queda da curva de capital após um topo. Exemplo: 10k → 20k → 12k DD = -40% Recovery Factor Capacidade da estratégia recuperar drawdown. Lucro Líquido / DD Máximo Payoff Lucro médio esperado por trade. Lucro líquido / total de trades Win Rate Percentual de operações vencedoras. Win rate sozinho não define qualidade. Uma estratégia pode ter: 40% acerto e ainda ser lucrativa. AHPR Retorno médio aritmético por operação. GHPR Retorno geométrico composto. Mais importante para avaliar crescimento real da conta. LR Correlation Corr...

Procurar por funções de verossimilhanças em modelos estatístico é só uma decomposição para voltar a algo que já estava ali?

Durante o desenvolvimento e a calibragem de uma estratégia automatizada para operar o mini índice da Ibovespa, surgiu uma questão conceitual. A rotina de otimização de parâmetros em uma EA envolve testar combinações que maximizam lucro, reduzem drawdown ou melhoram a curva de capital. Esse processo parece empírico. A pergunta foi se existe um paralelo formal com inferência estatística. Em termos estatísticos, a função de verossimilhança é definida como L(θ|x)=p(x|θ), tratada como função do parâmetro θ, com os dados x fixados. A operação central é a troca de papéis. Em p(x|θ), x é variável aleatória e θ é fixo. Na verossimilhança, x passa a ser observado e θ varia. Isso permite inferência sobre θ. Se X₁,…,Xₙ são independentes, a verossimilhança assume a forma de produto: L(θ|x)=∏ᵢ p(xᵢ|θ) Aplicar log transforma produto em soma. Isso simplifica a otimização numérica. A fatoração não altera a informação. Apenas reorganiza a expressão. Pelo teorema de fatoração de Ronald Fisher: L(θ|x)=g(T...

O que é função de plausibilidade relativa?

Função de plausibilidade relativa é a verossimilhança normalizada pelo seu valor máximo. Para um modelo com parâmetro (\theta) e dados (x), define-se R(\theta\mid x)=\frac{L(\theta\mid x)}{L(\hat{\theta}\mid x)} onde (L(\theta\mid x)) é a função de verossimilhança e (\hat{\theta}) é o estimador de máxima verossimilhança . Propriedades. O valor de (R(\theta\mid x)) está no intervalo ([0,1]). O máximo é 1, atingido em (\hat{\theta}). A função preserva a ordem de preferência entre valores de (\theta). Se (R(\theta_1\mid x) > R(\theta_2\mid x)), então (\theta_1) é mais compatível com os dados que (\theta_2). Interpretação. A função expressa evidência relativa fornecida pelos dados para diferentes valores de (\theta). Não é uma probabilidade em (\theta). Não integra 1 no espaço paramétrico. Não incorpora priori. Uso. Intervalos de plausibilidade são definidos por conjuntos ({\theta: R(\theta\mid x)\ge c}), com limiar (c) fixado. Testes baseados em razão de verossimilhança usam a mesma ...

Lista de modelos de Machine Learning com suas respectivas aplicações

É bom lembrar-se de que cada problema é único e pode exigir mais de um modelo de Machine Learning para obter resultados satisfatórios. Além disso, a escolha final de modelo depende do tamanho e natureza dos dados e das expectativas de desempenho, mas aqui segue uma lista de modelos e suas respectivas aplicações Regressão Linear: Problemas de previsão numérica, como prever o preço de uma casa com base em suas características. Regressão Logística: Problemas de classificação binária, como prever se um cliente será inadimplente. Árvore de Decisão: Problemas de classificação e tomada de decisão, como determinar se um paciente tem uma determinada doença com base em sintomas. Random Forest: Problemas de classificação e regressão, como prever a satisfação de um cliente com base em características de produto e serviço. SVM (Support Vector Machine): Problemas de classificação, especialmente para dados com muitas características e poucas amostras. Naive Bayes: Problemas de classificação, especial...

Principais igualdades de probabilidade

Pode ser útil, saber: P(A) + P(A') = 1 (complementaridade) P(A ∪ B) = P(A) + P(B) - P(A ∩ B) (regra da adição) P(A | B) = P(A ∩ B) / P(B) (regra de Bayes) P(A ∩ B) = P(A | B) * P(B) (identidade de Bayes) P(A | B) = P(B | A) * P(A) / P(B) (regra de Bayes inversa) P(A ∪ B) = P(A) + P(B) - P(A) * P(B) (regra da multiplicação) P(A ∩ B) = P(A) * P(B | A) (regra da multiplicação) P(A | B) = P(B | A) * P(A) / P(B) (regra de Bayes inversa) P(A | B ∩ C) = P(A | B) * P(A | C) (regra de condicionamento) P(A | B) = P(A ∩ B) / P(B) (regra de Bayes) Lembre-se que estas igualdades só se aplicam quando certas condições são atendidas, como eventos independentes, eventos mutuamente exclusivos, entre outros. 

Cursos Gratuitos para Análise de Dados (Harvard/Johns Hopkins)

Cursos online de alta qualidade para Análise de Dados, todos com inscrição gratuita. Harvard 1. Estatística e R: https://lnkd.in/ggwKPfH3 2. Probabilidade: https://lnkd.in/gRA-sCrU 3. Regressão linear: https://lnkd.in/gCqYdf_W 4. Inferência e Modelagem: https://lnkd.in/gSnuYTMW RICE (Curso) Introdução à análise de dados com Excel: https://lnkd.in/gBVHWzvR Johns Hopkins (Coursera) Estatística avançada para especialização em ciência de dados: https://lnkd.in/g_n-3Wn5 *você pode explorar os vídeos e materiais  do Coursera clicando em 'Auditar o curso'.  *os cursos são ministrados em inglês e alguns tem legendas em português. As paginas do curso podem ser traduzida pelo seu navegar.

Por quê é precipitado definir outliers em análise exploratória. Afinal o que é um outiler?

Imagem
Em minha última aula de Estatística inferencial, um colega de sala fez a seguinte pergunta:  Professor, tem algum tratamento especial para evitar que a função de verossimilhança não tenha outliers? E o professor Wagner explicou de forma lucida:  Não, não tem nada. Porque o outlier é um problema além do modelo. O quê que é um outlier? É um ponto em que a probabilidade de você encontra-lo dado o modelo que você está assumindo é muito pequena. Então normalmente a presença de um outlier indica pra você que o teu modelo não é bom suficiente ou que você tem problemas nos dados. E é muito importante também pensar que só existe a noção de outlier por que existe a noção de modelos, dessa forma não faz sentido você procurar outliers na análise exploratória. Porquê o outiler é algo que teu modelo não conseguiu explicar e isso pode ser motivado novamente ou pelo modelo que está muito simples ou realmente você tem um problema na base de dados. Agora para você afirmar isto você precisa...