A previsão do projeto não é um processo direto – é um exercício científico e estatístico que lida com inúmeras variáveis interconectadas. O valor dessas variáveis pode ter um impacto significativo em sua previsão final. Conhecer a distribuição de frequência desses valores permite que você tome decisões baseadas em dados.
O tipo de distribuição de frequência é especialmente importante ao fazer previsões com a simulação de Monte Carlo . Neste artigo, explicaremos as formas de distribuição de frequência que você encontrará com mais frequência.
☛ Distribuição Normal
A distribuição normal, também conhecida como distribuição Gaussiana ou “curva de sino” é a distribuição de frequência mais comum. Essa distribuição é simétrica, com a maioria dos valores caindo em direção ao centro e caudas longas à esquerda e à direita. É uma distribuição contínua, sem lacunas entre os valores.
Distribuições normais são encontradas em todos os lugares, tanto para fenômenos naturais quanto para fenômenos produzidos pelo homem. Isso pode incluir o tempo necessário para concluir uma tarefa, os resultados do teste de QI ou a altura de um grupo de pessoas. No gerenciamento de projetos, ao realizar estimativas enquanto você não tem mais informações sobre o tipo de distribuição de frequência, geralmente é melhor assumir uma distribuição normal.
☛ Distribuição Assimétrica
Quando uma curva normal se inclina para a esquerda ou para a direita, ela é conhecida como distribuição assimétrica. A localização da cauda longa – não do pico – é o que dá nome a essa forma de distribuição de frequência. Uma cauda longa à direita é referida como enviesada para a direita ou enviesada positivamente, enquanto uma cauda longa à esquerda é referida como enviesada para a esquerda ou enviesada negativamente.
As distribuições assimétricas positivas são comuns em situações em que há um limite inferior fixo. Por exemplo, entrega de um componente – se a maioria das entregas acontecer em 3 dias, o valor mínimo é 0, mas a cauda longa pode se estender muito para a direita se algumas entregas atrasarem.
Distribuições negativamente assimétricas são menos comuns em geral, mas ainda aparecem quando limites superiores fixos ou quase fixos estão em jogo. Por exemplo, uma empresa que garante que todos os pedidos serão entregues dentro de 1 semana provavelmente verá algumas entregas mais rápidas, mas a maioria dos valores se agrupa perto do ponto de 1 semana.
Um fato importante sobre distribuições assimétricas é que, ao contrário de uma curva em forma de sino, a moda, a mediana e a média não têm o mesmo valor. A cauda longa inclina a média e a mediana na direção da cauda. Existe uma maneira muito fácil de calcular os diferentes valores médios usando um diagrama de histograma . Se você confia em valores médios para fazer previsões rápidas , preste atenção em qual média você usa!
☛ Distribuição Bimodal/Multimodal
Todos os tipos de distribuição de frequência que vimos até agora foram unimodais – os valores se agrupam em torno de um único pico. Uma distribuição bimodal ocorre quando duas distribuições unimodais estão no grupo que está sendo medido. Quando ocorrem mais de dois picos, é conhecida como distribuição multimodal.
Essa forma de distribuição ocorre frequentemente quando os dados medidos podem ser divididos em dois ou mais grupos. Um exemplo seria a vazão de todas as tarefas do seu time. Se seu time estiver usando classes de serviço para lidar com urgências mais rapidamente do que tarefas regulares, você provavelmente verá uma distribuição bimodal.
Se você identificar uma distribuição de frequência bimodal, vale a pena verificar se pode dividir os dados medidos em subgrupos para ver a forma de cada grupo.
☛ Distribuição Uniforme
Em uma distribuição uniforme ou retangular, todo valor variável entre um máximo e um mínimo tem a mesma chance de ocorrer. A probabilidade de rolar um certo número em um dado ou escolher uma certa carta do baralho é descrita por essa forma de distribuição de frequência.
Essa distribuição de frequência aparece no início de todo projeto. Uma distribuição uniforme assume que todas as amostras de sua população são igualmente prováveis. Ao lançar um dado, todos os números no dado têm a mesma chance de sair em cada lançamento. Digamos que você tenha dezenove amostras de uma população uniformemente distribuída. Em uma distribuição uniforme, há uma probabilidade muito alta de que a próxima amostra esteja entre o mínimo e o máximo das amostras anteriores. Isso significa que você tem uma compreensão razoavelmente boa do alcance de sua distribuição uniforme depois de coletar apenas vinte pontos de dados.
☛ Logarítmico/Pareto
Alguns conjuntos de dados têm quase todos os seus valores de frequência agrupados em um lado do gráfico. Essa forma de distribuição de frequência é conhecida como logarítmica. Um exemplo comum disso na vida real é encontrado nas distribuições de riqueza e renda, com um grande número de pessoas na parte inferior, mas valores discrepantes extremos estendendo a cauda para a direita.
Esse tipo de distribuição é frequentemente conhecido como distribuição de Pareto, em homenagem ao famoso economista e sociólogo italiano Vilfredo Pareto. Você quase certamente já ouviu falar de sua regra 80-20. Por exemplo, 80% da riqueza de uma sociedade está nas mãos de 20% da sociedade, 80% da receita vem de 20% dos clientes e 80% da produtividade vem de 20% de sua equipe.
Embora as porcentagens nem sempre sejam 80-20, esse padrão aparece principalmente em modelos de estimativas financeiras.
☛ PERT/Triangular
Os tipos de distribuição de frequência PERT e triangular são modelados a partir dos mesmos 3 valores – um mínimo, um máximo e uma moda. Esse tipo de distribuição é especialmente útil quando apenas uma pequena quantidade de dados de desempenho anteriores está disponível. Ele usa apenas três valores como entradas – a, m e b.
Enquanto a distribuição triangular é uma forma simples feita usando linhas retas entre cada um dos 3 valores, a distribuição PERT assume que os valores de cauda longa aparecem com menos frequência. A forma de distribuição de frequência gerada a partir desses três valores é então usada para estimar os tempos prováveis de conclusão.
Compreender a distribuição de frequência de seus dados é importante tanto para a entrada quanto para a saída de suas previsões. Saídas realistas são simplesmente impossíveis sem entradas precisas. Cálculos que dependem de estimativas subjetivas são arriscados – recomendamos sempre usar seus dados de desempenho anteriores.
Qual é a distribuição de frequência de seus dados? Você usou diagramas de histograma para analisá-lo? Você usa histogramas para fazer suas estimativas? Conte-nos sobre sua experiência nos comentários!
Versão traduzida por Déborah Alvarenga. Tradução autorizada do blog da ferramenta Nave, sendo a Arkhi Business Agility a sua principal parceira no Brasil. Artigo original: https://getnave.com/blog/frequency-distribution-types/