Enquanto a segunda parte do estudo sobre o Di Cavalcanti está no forno, resolvi trazer para vocês alguns insights super interessantes que todo esse processo de ciência de dados aplicado à arte está proporcionando.

Introdução

Sendo honesto, não seria nenhum absurdo ouvir que agentes do mercado de arte — como novos entrantes ou entusiastas — utilizam alguma relação entre o tamanho e preço de obras de arte (como valor/m²) para precificar determinada pintura. Isso está errado. Existe a necessidade de informações além do tamanho para precificar obras de arte, e eu vou provar isso para você com ✨estatística✨

Em um ecossistema com tamanha assimetria de informações, como o das Artes Visuais, cada agente toma um meio diferente para avaliar obras (ativos). Entretanto, antecipo desde já: Tratar obras de arte como tecidos, ou seja, utilizar relações entre tamanho e preço para precificar algum ativo é dar um tiro no próprio pé.

Para provar isso, analisei o poder explicativo de medidas de tamanho (como Perímetro, M², CM²) sobre os preços destas obras do Di Cavalcanti. Utilizei um método estatístico chamada regressão linear univariada e o software SPSS.

Antes de mais nada: Caso você queria entender melhor os resultados que vou apresentar, vale a pena ler os anexos no final do artigo! Neles, digeri ao máximo a explicação sobre a estatística envolvida aqui. Dessa forma todos poderão entender os resultados. Por outro lado, caso você queira ir direto ao “finalmente”, siga em frente!

Então… Vamos aos resultados!

Resultados

De maneira sucinta, preparei duas tabelas com algumas medidas estatísticas necessárias para provar a necessidade de informações além do tamanho para precificar obras. Nestas tabelas, também existem ✨explicações hiper resumidas✨ de como interpretar medidas estatísticas, assim todos poderão entender a análise!

Sem mais delongas, a primeira tabela explora o poder explicativo (vide anexo 2) de medidas de tamanho, como PerímetroLog do M²Log do PerímetroCm², e Log do Cm², em relação ao Preço em dólares não corrigidos de obras do Di Cavalcanti.

Por sua vez, a segunda tabela comenta o poder explicativo das mesmas medidas, mas agora sobre o Log do Preço de obras do Di Cavalcanti.

Caso você tenha dúvidas sobre a utilização da redução dimensional com o Log, vide o anexo 3.

Para os resultados apresentados serem confiáveis, é necessário que a relação entre as duas variáveis não seja apenas uma coincidência (vide anexo 2). Se o p-value for menor que 5%, isso significa que a relação é provavelmente verdadeira e não apenas um acaso.

A tabela mostra duas variável com p-value maior que 5%. Ou seja, a relação entre o preço, o CM² e o  não é muito confiável.

As variáveis restantes, são o PerímetroLog do PerímetroLog do M² Log do CM². Neste momento, olharemos para o R², uma vez que esta medida é um indicador do poder explicativo de cada variável sobre o preço.

Como demonstra a tabela, o R² (em %) do Perímetro é de 3.6%. Isso quer dizer que a relação entre essa variável e o preço é quase nula…

Por sua vez, quando falamos das variáveis Log do M²Log do CM² e Log do Perímetro, com R² de respectivamente 14%15% e 10,9%, a relação é um pouco mais forte quando comparado ao perímetro, mas ainda está longe do ideal!

Bom, até agora vimos que o poder explicativo (R²) de qualquer medida de tamanho em relação ao preço não é alto… Ou seja a relação não é muito forte…

Mas eu não desisti por aqui!

Tendo em vista estes resultados, resolvi me apoiar em alguns autores, como Sebastian Edwards (2004), e utilizar uma redução dimensional dos preços como tentativa de trazer medidas mais acuradas. E… até que deu certo! Veja a tabela 2.

Bom, assim como na tabela 1, o p-value do  e CM² deram maiores que 5%. Logo… bye bye para essas variáveis.

Quem sobrou? Perímetro, Log do M², Log do Perímetro e Log do CM². Quais as capacidades explicativos (R²) deles? 3,2%19%15% e 17,4%.

Como podemos observar, o resultado deu um pouco melhor que o anterior, mas ainda está ruim…

De maneira resumida, ao analisar as medidas estatísticas relacionadas ao preço das obras de Di Cavalcanti, juntamente com diferentes medidas de tamanho, pude observar que a relação entre o preço e essas medidas não é muito forte em geral!

Mas e aí, M², CM² ou Perímetro?

A resposta é: depende.

Em todo caso, saiba que o poder explicativo dessas variáveis com ou sem redução dimensional é extremamente baixo. Ou seja, não utilize apenas medidas de tamanho para avaliar preços de quadros.

 

Se eu estivesse no lugar de um Art Advisor e tivesse que escolher uma dessas variáveis métricas e tamanho para compor um modelo de precificação eu pensaria da seguinte forma:

Conclusão:

Tendo em vista o esforço deste artigo em comparar quanto medidas de tamanho (como Perímetro, M², CM²) tem poder explicativo sobre os preços destas obras do Di Cavalcanti, foi possível observar que há necessidade de considerar informações além das medidas de tamanho para uma precificação mais acurada. As relações entre o preço e as medidas de tamanho são limitadas, indicando que outros fatores também podem influenciar significativamente o valor das obras.

Pessoal, por hoje é isso! Continuo enfrentando alguns desafios nessa jornada, mas continuo caminhando para resultados interessantes! Obrigado por me acompanharem e até a próxima!

Anexos

Lembre-se, essas são simplificações, mas espero que elas ajudem a entender esses conceitos básicos da regressão linear

O Anexo 1 : A equação da regressão linear.

Pk = β0 + β1Xmk + εk

  • Pkt é o preço da obra de arte k
  • Xmk é o valor do atributo m da obra de arte k (M², Cm², Perímetro)
  • βm é o preço do atributo m.
  • εk é o erro aleatório.

O Anexo 2: R², Significância e Beta:

  1. R² (R-quadrado): Imagine que você está tentando desenhar uma linha em um gráfico para prever algo, como o crescimento de plantas baseado na quantidade de sol que elas recebem. O R² é uma medida que diz o quão bem essa linha se ajusta aos pontos reais no gráfico. Se o R² for 1, a linha encaixa perfeitamente nos pontos; se for 0, a linha não tem nada a ver com os pontos.
  2. Significância: Quando fazemos uma regressão, estamos tentando encontrar uma relação entre duas coisas, como sol e crescimento de plantas. A significância nos ajuda a saber se essa relação que encontramos é real ou apenas uma coincidência. Se a significância é alta, isso significa que a relação é provavelmente verdadeira e não apenas um acaso.
  3. Beta (coeficiente): Quando desenhamos a linha de regressão, precisamos descobrir o quão íngreme ela deve ser. Isso é o “Beta”. Em termos simples, é como descobrir quanto o crescimento das plantas muda quando a quantidade de sol muda um pouquinho.

O Anexo 3: Uso do Log em regressões:

Às vezes, os dados não se encaixam bem em uma linha reta. Mas, se você aplicar o log (logaritmo) nos dados, eles podem começar a se parecer mais com uma linha reta no gráfico. Isso é útil porque as regressões lineares funcionam melhor com dados que se comportam linearmente. Então, ao aplicar o log, você transforma os dados para que a relação entre eles possa ser melhor representada por uma linha reta. Isso pode facilitar a previsão e interpretação dos resultados da regressão.

 

Texto de: Eduardo Freitas Valle: Pesquisador Científico | Entusiasta de Arte | Estudo o Mercado Financeiro e o Mercado de Arte