Home » Artigos arquivados » Desempenho do Phenom

Desempenho do Phenom

Autor: Laércio Vasconcelos
Data: 22/fevereiro/2008

Sinopse
O Phenom, novo processador de 4 núcleos da AMD, tem um bom desempenho e tem muitas condições técnicas para melhorar nos modelos futuros. Confira os resultados dos nossos testes.

 

AMD x Intel

É um grande perigo para qualquer colunista de hardware abordar processadores. Mesmo quando comprovadamente e imparcialmente chegamos a conclusões que mostrem pontos positivos de um fabricante em comparação com outro, sempre existirão as reclamações dos fãs de plantão, que consideram produtos de um fabricante muito melhores que os do outro. A verdade é que todos querem usar um processador com várias características desejáveis. Dependendo da aplicação, algumas podem ser mais importantes que outras:

  • Boa performance
  • Preço acessível
  • Boa confiabilidade
  • Baixo aquecimento
  • Compatibilidade com programas

É preciso levar em conta o seguinte: o que é melhor para um não necessariamente é melhor para outro. Só a velha discussão entre Intel e AMD já é suficiente para mais de 100 comentários. Procuremos concentrar as atenções no objeto principal do artigo, que é o novo processador AMD Phenom. Sendo um processador de quatro núcleos, seus concorrentes diretos são o Core 2 Quad e o Core 2 Extreme Qxxxx, da Intel.

Os primeiros modelos do Phenom

Processadores Phenom são baseados na arquitetura K10. A primeira versão do seu núcleo é chamada Barcelona. São quatro núcleos em um único die. Cada núcleo tem 128 kB de cache L1 e 512 kB de cache L2 exclusiva. Uma cache L3 de 2 MB está presente no chip, e é compartilhada entre os quatro núcleos. Ao todo são cerca de 460 milhões de transistores.
Figura 1 – Pastilha de quatro núcleos do Phenom

Os quatro núcleos operam com freqüências e voltagens independentes. Durante um pico com carga máxima de trabalho, os núcleos operam com freqüência e voltagens máximas, mas nos períodos em que a carga máxima de trabalho não é exigida, os núcleos podem ter suas voltagens e freqüências reduzidas de forma independente, resultando em redução no consumo de energia e no aquecimento.
Figura 2 – Estrutura de caches do Phenom

A figura 2 mostra a estrutura interna do Phenom, destacando os núcleos e as suas caches. Cada núcleo tem à sua disposição caches L1 e L2 (128 kB e 512 kB), além da cache L2 de 2 MB compartilhada. O chip tem dois canais de memória DDR2, suportando DDR2/400, DDR2/533, DDR2/667, DDR2/800 e DDR2/1066.
Figura 3 – Processador AMD Phenom

Um Phenom é na verdade um Athlon 64 “X4”, com grandes melhoramentos. Poderia ser chamado de Athlon 64 X4. Os modelos disponíveis estão descritos em www.amdcompare.com. Todos eles usam o Socket AM2+, uma nova versão com a mesma disposição de pinos do AM2, mas com diferenças na alimentação elétrica e na maior velocidade do barramento HyperTransport.

Modelo Clock HT Temp Potência Cache L1 Cache L2 Cache L3 Processo
9500 2.2 GHz 3600 MHz 70°C 95 W 128 kBx4 512 kBx4 2 MB 65 nm
9600 2.3 GHz 3600 MHz 70°C 95 W 128 kBx4 512 kBx4 2 MB 65 nm
9700 2.4 GHz 3600 MHz 70°C 125 W 128 kBx4 512 kBx4 2 MB 65 nm

OBS: O Phenom 9700 ainda não foi disponibilizado (fev/2008). É comprovado que será um modelo de 2.4 GHz, mas sua temperatura máxima permitida (70 graus) e sua dissipação de potência elétrica (125 W) precisam ser confirmadas, acompanhe as informações oficiais em www.amdcompare.com.

Outros modelos de Phenom chegarão logo ao mercado, mas é conveniente entender alguns pontos importantes. Um deles é o barramento HyperTransport 3.0, que opera com clock de 3.6 GHz. A versão anterior operava com até 2.0 GHz. Em ambos os casos, o link HyperTransport opera com duas vias de 16 bits, sendo uma para transmissão e outra para recepção. Com esses parâmetros podemos calcular a banda (throughput) do barramento:

  • HyperTransport:  2 canais x 16 bits (2 bytes) x 2.0 GHz = 8 GB/s
  • HyperTransport 3.0:  2 canais x 16 bits (2 bytes) x 3.6 GHz = 14.4 GB/s

Note que para o barramento HyperTransport do Phenom operar com 3.6 GHz, é preciso usar uma placa mãe com Socket AM2+. Placas com Socket AM2 a princípio permitirão a instalação do Phenom, mas o seu barramento HyperTransport ficará limitado a 2.0 GHz.

A AMD também lançará versões do Phenom com 2 e 3 núcleos. A idéia inicial é aproveitar processadores com defeito de fabricação. Um único transistor defeituoso normalmente inutiliza um chip inteiro. No caso a AMD simplesmente pode desativar um dos núcleos e vender este processador como um “Phenom X3”.

O Socket AM2+

Como sabemos, o Socket AM2 substituiu o Socket 939. A principal diferença é o suporte a memórias DDR2, chegando até DDR2/800. O barramento HyperTransport do Socket AM2 tem a mesma velocidade do barramento HyperTransport do Socket 939: 2000 MHz (1000 MHz x2). Simultaneamente com o lançamento do Phenom, a AMD criou uma nova versão do Socket AM2, chamada Socket AM2+ (também chamado internamente na AMD de AM2r2). Soquetes AM2 e AM2+ são compatíveis, têm a mesma disposição de pinos. Processadores Phenom podem ser instalados tanto em placas com Socket AM2+ (o ideal) quanto em placas com Socket AM2. Processadores mais antigos para Socket AM2 (Athlon 64, Athlon 64 X2, etc.) podem ser instalados em placas mãe com Socket AM2+, a compatibilidade é total.

Quando um processador Phenom é instalado em uma placa mãe com Socket AM2+, existirão duas vantagens:

1) Barramentos de alimentação elétrica separados para os núcleos e para o controlador de memória.

No Socket AM2, a mesma tensão de alimentação serve para os núcleos e para o controlador de memória localizado no processador. Como maiores freqüências exigem maiores voltagens (e vice-versa), manter a memória funcionando em plena velocidade exige maior tensão para o controlador de memória e para os núcleos, mesmo que esses núcleos estejam pouco ocupados. Para reduzir o consumo de energia nos momentos em que existe pouca demanda de processamento, processadores com Socket AM2 precisam reduzir tanto a tensão dos núcleos quanto a do controlador de memória, o que obriga a uma redução na velocidade das memórias. Em uma situação na qual o chipset está transferindo dados para a memória e os núcleos estão ociosos, duas coisas podem ocorrer: os núcleos ficariam operando com tensão maior sem necessidade (e consumindo mais energia), ou a tensão total diminuiria, tornando o acesso à memória mais lento. No Socket AM2+, com tensões diferentes para os núcleos e para o controlador de memória, os núcleos poderiam estar operando com freqüência e tensão menores (ociosos) enquanto o controlador de memória estaria operando em plena velocidade, já que tem tensão maior. Parece complicado, mas a simples divisão da alimentação em duas seções independentes permite redução no consumo de energia (e aquecimento) e aumento do desempenho da memória.

Processadores com Socket AM2+ suportam memórias até DDR2/1066, contra DDR2/800 do Socket AM2. Note que nem todos os modelos de processadores para Socket AM2+ suportam memórias DDR2/1066, alguns podem ser limitados a velocidades menores, da mesma forma como o Sempron para Socket AM2 opera com no máximo DDR2/667.

2) O barramento HyperTransport de processadores com Socket AM2+ opera com maiores velocidades. 

No Socket 754, 939 e AM2, a velocidade é de 1600 ou 2000 MHz (800 MHz x2 e 1000 MHz x2, já que o HyperTransport opera em modo DDR). O Socket AM2+ especifica freqüências de 3600 a 5200 MHz (1.8 GHz x2 a 2.6 GHz x2). É a especificação HyperTransport 3.0. Os primeiros modelos de Phenom operam com 3600 MHz no HyperTransport, novos modelos irão operar com maiores velocidades.

Os soquetes AM2 e AM2+ são compatíveis. Processadores um pouco mais antigos, para Socket AM2, funcionam em placas mãe com Socket AM2+, entretanto seu barramento HyperTransport fica limitado a 2000 MHz e a alimentação dos núcleos e da memória é unificada. Processadores projetados para Socket AM2+, como o Phenom, funcionam em placas mãe com Socket AM2, mas o barramento HyperTransport ficará também limitado a 2000 MHz e a alimentação elétrica dos núcleos e do controlador de memória é única. Para que o Phenom opere com seu desempenho máximo nas transferências de entrada e saída (HyperTransport) e com redução de consumo elétrico, é preciso que seja usada uma placa mãe com Socket AM2+.

Plataforma Spider

Depois de comprar a ATI, a AMD passou a ter à sua disposição chipsets exclusivos, como sempre tem feito a Intel. No passado a AMD produziu alguns chipsets, mas esse não é o seu foco, e por isso sempre dependeu de fornecedores como Nvidia, VIA, SiS e ALI. A ATI sempre produziu chips gráficos, e nos últimos anos passou a criar também chipsets. O projeto conjunto de processador e chipset pode trazer várias vantagens, como a maior estabilidade. Como a ATI produz chips gráficos e chipsets, foi criada a especificação de uma plataforma completa, incluindo processador, chipset e chip gráfico, todos totalmente compatíveis entre si. Isso reduz a chance de incompatibilidades, como problemas na comunicação entre um chipset X e um chip gráfico Y. Usando uma plataforma fixa, os fabricantes de software e hardware podem criar produtos mais, digamos assim, “testados”.

A plataforma AMD Spider é composta de processador, chipset e chip gráfico:

  • Processador: AMD Phenom de 4 núcleos
  • Chipset: AMD série 7 (790FX, 790X e 770)
  • Chip gráfico: ATI HD 3800 (HD 3850, HD 3870)

Figura 4 – Plataforma SPIDER

A principal diferença entre os três chipsets possíveis é a número de placas de vídeo que podem ser instaladas, seguindo o padrão CrossfireX. O chipset 790FX suporta quatro slots PCI Express x16, o 790X suporta duas placas, e o 770 é para um sistema normal, com uma só placa de vídeo.

O sistema testado

Recebemos da AMD para avaliação um sistema SPIDER com os seguintes componentes:

  • Processador AMD Phenom de 2.6 GHz (amostra de engenharia)
  • Placa mãe Asus M3A32-MVP Deluxe
  • Placa de vídeo ATI HD 3870
  • Placa de vídeo ATI HD 3850

O sistema não veio acompanhado de memória, então usamos componentes disponíveis no nosso laboratório: 2 módulos de 1 GB, DDR2/800, da Corsair.
Figura 5 – Placa Asus M3A32-MVP Deluxe

A placa mãe recebida é do tipo “Wi-Fi Edition”. Possui um módulo wi-fi onboard, padrão IEEE 802.11g.
Figura 6 – Módulo Wi-Fi onboard

A placa mãe tem ainda conectores FireWire, SATA externo, rede gigabit, áudio de 8 canais, SPDIF, 10 portas USB 2.0.
Figura 7 – Conectores da placa mãe

Os dois componentes do chipset e mais os reguladores de voltagem são acoplados a dissipadores passivos de cobre, interligados por heat pipes. A placa é fornecida com um segundo dissipador de cobre para as memórias. É útil para quem pretende fazer overclock sobre as memórias.
Figura 8 – Dissipador de calor para as memórias

Assim como ocorre com qualquer processador com mais de um núcleo (e também com os processadores HT da Intel, que têm dois núcleos “virtuais”), o Phenom aparece no Gerenciador de dispositivos como um conjunto de CPUs, no caso, 4 (figura 9). Vemos que o modelo testado é uma amostra de engenharia, mas segundo a AMD, equivale a um modelo de 2.6 GHz que será lançado em abril/2008.
Figura 9 – Gerenciados de dispositivos – o Phenom aparece como um grupo de 4 processadores.

O Gerenciador de tarefas exibe quatro gráficos de uso da CPU, sendo um para cada núcleo.
Figura 10 – Uso da CPU, com indicação de quatro gráficos
Figura 11 – Identificação do Phenom no programa CPU-Z versão 1.44

Entre os vários programas que fazem identificação de processadores, citamos o CPU-Z versão 1.44, obtido em www.cpuid.com (figura 11). O programa identifica vários parâmetros importantes, como clocks, tamanho das caches o número de núcleos, etc.

Desempenho da CPU

Nos nossos testes de desempenho, procuramos responder as seguintes perguntas:

1) Como é o desempenho do processador para processamento simples e dual, em comparação com processadores AMD da geração anterior (Athlon 64 X2)?

2) Como é o desempenho do processador para processamento com uso dos quatro núcleos, em comparação com processadores concorrentes da Intel, levando em conta custo e desempenho?

Existem sites que realizam benchmarks bastante completos, envolvendo praticamente todos os processadores disponíveis. Citamos entre eles, o Tom’s Hardware Guide. Os testes que realizamos não têm como objetivo a precisão absoluta, principalmente pelo fato de não termos à disposição todos os processadores do mercado. Dentro do possível, procuramos analisar qualitativamente sistemas com configurações parecidas.

Comparando com o Athlon 64 X2

Vários programas são usados pela mídia especializada para medir o desempenho de computadores. Um deles, bastante popular, é o PCMark2005. Apesar de estarmos em 2008, essa ainda é a versão disponível e usada mundialmente. Entre os vários testes realizados pelo PCMark2005, escolhemos o “CPU Test Suite” (figura 12). Consiste em um conjunto de 8 testes que envolvem processamento intensivo. Seis deles são tarefas monoprocessadas, um deles realiza duas tarefas simultâneas de processamento intensivo, e o último realiza quatro tarefas simultâneas. Os testes envolvem compressão e descompressão de dados, codificação e decodificação usando criptografia, compressão e descompressão de som e vídeo. Processadores de dois ou quatro núcleos levam vantagem no sétimo teste (processamento dual), e processadores de quatro núcleos levam vantagem no último teste (quatro tarefas simultâneas).
Figura 12 – Testes de CPU com o PCMark2005

O resultado final é um índice de desempenho que pode ser usado para a comparação entre processadores diferentes.

Antes de checar o desempenho do Phenom, façamos a medida em um típico processador dual da própria AMD, o Athlon 64 X2 4800, com cache L2 de 2 MB (1 MB x2) e 2 GB de memória DDR400 operando em dual channel. A tabela abaixo mostra os resultados obtidos. Note que o programa PCMark 2005 faz 8 testes, sendo que o sétimo envolve processamento dual e o oitavo envolve processamento “quádruplo”.

Athlon 64 X2 4800 – PC Mark 2005 CPU

    Athlon 64 X2 4800
1 Compactação de arquivos 9,254 MB/s
2 Descompactação de arquivos 141,692 MB/s
3 Encriptação de arquivos 49,529 MB/s
4 Decriptação de arquivos 41,481 MB/s
5 Descompressão de imagem 27,617 Mpixels/s
6 Compressão de áudio 2728 kB/s
     
7A Compactação de arquivos 9,252 MB/s
7B Encriptação de arquivos 49,936 MB/s
     
8A Descompactação de arquivos 70,470 MB/s
8B Decriptação de arquivos 20,910 MB/s
8C Descompressão de áudio 1100 kB/s
8D Descompressão de imagem 13,774 Mpixels/s
     
  TOTAL 4904

Os processamentos indicados em 7A e 7B são realizados simultaneamente. Note que o resultado de 7A é idêntico ao do teste 1, e o resultado do teste 7B é idêntico ao do teste 3. Isto significa que mesmo realizando duas tarefas pesadas simultâneas, não ocorre queda de desempenho em comparação com as tarefas monoprocessadas.

No teste 8 são realizadas quatro tarefas simultâneas com processamento intensivo. Como são apenas dois núcleos, o desempenho é reduzido. Note que o resultado do teste 8A é aproximadamente a metade do obtido no teste 2. O mesmo ocorre quando comparamos as pontuações 8B/4 e 8D/5.

O Phenom usado no nosso teste tem clock de 2.6 GHz, mas é uma amostra de engenharia e tem multiplicador de clock destravado. Ajustamos no CMOS Setup o multiplicador para 12x, para que opere com 2.4 GHz, permitindo uma comparação mais precisa com o Athlon 64 X2, que também opera com 2.4 GHz. Dessa forma, o Phenom testado ficou com desempenho próximo do de um modelo 9700. Os resultados dos testes são apresentados na tabela abaixo, juntamente com os do Athlon 64 X2 4800.

Os testes de 1 a 6 são monoprocessados, ou seja, apenas um núcleo trabalha. Como os dois processadores testados têm núcleos similares, com mesmo clock, os resultados deveriam ser iguais. Entretanto, o Phenom apresentou ganhos de até 30%, ou seja, um núcleo do Phenom pode ser até 30% mais rápido que o núcleo de um Athlon 64 X2 de mesmo clock. Esse ganho é devido a melhoramentos na arquitetura interna do processador, como a unidade de ponto flutuante e a cache L3.

    Athlon 64 X2 4800 Phenom 9700 Ganho
1 Compactação de arquivos 9,254 MB/s 10,962 MB/s +18%
2 Descompactação de arquivos 141,692 MB/s 142,791 MB/s +0,7%
3 Encriptação de arquivos 49,529 MB/s 62,363 MB/s +25,9%
4 Decriptação de arquivos 41,481 MB/s 54,210 MB/s +30,6%
5 Descompressão de imagem 27,617 Mpixels/s 29,672 MB/s +7,4%
6 Compressão de áudio 2728 kB/s 2777 kB/s +1,7%
         
7A Compactação de arquivos 9,252 MB/s 11,093 MB/s +19,8%
7B Encriptação de arquivos 49,936 MB/s 63,123 MB/s +26,4%
         
8A Descompactação de arquivos 70,470 MB/s 144,587 MB/s +105%
8B Decriptação de arquivos 20,910 MB/s 53,737 MB/s +157%
8C Descompressão de áudio 1100 kB/s 2288 kB/s +108%
8D Descompressão de imagem 13,774 Mpixels/s 29,705 Mpixels/s +115%
         
  TOTAL 4904 7044 +43%

Da mesma forma, no teste 7 deveria ocorrer empate, já que apenas dois núcleos trabalham. O Phenom obteve resultados significativamente maiores: 19% e 26% mais rápido.

Finalmente, o teste 8 deveria mostrar ganhos de pelo menos 100% do Phenom em relação ao Athlon 64 X2. Seus quatro núcleos podem realizar simultaneamente as quatro tarefas simultâneas do teste, enquanto no Athlon 64 X2 seriam dois núcleos para executar quatro tarefas. O Phenom conseguiu ganhos acima de 100%, ou seja, sua velocidade foi mais que o dobro da obtida pelo Athlon 64 X2.

O índice apresentado pelo PCMark2005 é calculado em função das pontuações em cada um dos 8 testes. Levando em conta tudo isso, o Phenom ficou com 7044 pontos, contra 4904 do Athlon 64 X2, um ganho de 43%.

Nos instantes em que os quatro núcleos são utilizados intensamente, o Phenom é de 2x a 2,5x mais veloz que um Athlon 64 X2 de mesmo clock, já que são 4 contra 2. Ocorre que muito raramente os quatro núcleos são usados intensamente. Programas que lidam com geração de conteúdo de multimídia, como imagem, áudio e vídeo, tendem a utilizar os núcleos disponíveis do processador. Programas normais, em sua maioria, operam em modo monoprocessado, e a vantagem em ter quatro ao invés de dois núcleos torna-se menor. Notaremos melhora entretanto se usarmos dois programas “pesados” simultaneamente. Quando existem mais núcleos disponíveis, menor será a chance de um programa monopolizar o processador e dificultar a execução de outros programas.

Note que o teste de CPU do PCMark2005 é um exemplo do que chamamos “benchmark sintético”. Os componentes do computador são testados individualmente. Em um teste com aplicativos reais, o desempenho final dependerá de outros componentes, como o disco rígido, o sistema de vídeo e a memória. Em um teste de benchmark sintético, o objetivo é medir o desempenho de um subsistema, sem que outros subsistemas interfiram no resultado. Por exemplo, nos testes feitos com os processadores Athlon 64 X2 4800 e Phenom 9700 pode ser argumentado que as memórias são diferentes (DDR400 em dual chanel, e DDR2/800 em dual channel, respectivamente). O programa é feito de tal forma que o desempenho da memória não afeta o desempenho do processador. Não publicaremos os resultados, mas medimos o desempenho do Phenom com o programa PCMark2005 com três configurações de memória:

  • 2 GB (2 módulos de 1 GB, DDR2/800 em dual channel)
  • 2 GB (2 módulos de 1 GB, DDR2/800, em single channel)
  • 256 kB (1 módulo de 256 MB, DDR2/533, em single channel)

As diferenças de desempenho em todos os três testes foram inferiores a 1%. Isso não significa que a quantidade, velocidade e configuração de memória não afeta o desempenho total. A questão é que o PCMark2005 tem como objetivo nesse teste, checar o desempenho somente do processador, de forma independente da memória. Existem outros testes, inclusive dentro do próprio programa PCMark2005, que levam em conta o funcionamento conjunto de processador mais memória, entretanto no momento estamos analisando somente o processador.

Um teste popularmente utilizado para medir desempenho de processadores é a conversão de arquivos MPEG-2 de DVDs, transformando-os em arquivos AVI, usando um CODEC MPEG-4, como o DIVX. No nosso teste usamos o FlaskMPEG versão 078 e o DIVX versão 6.8 para converter um trecho de 1 GB de um filme (Uma noite no museu). Usamos a taxa padrão de 780 kbps, 29,97 FPS e áudio em MP3, com 48 kbps, 22 KHz estéreo. A taxa de conversão medida para os dois processadores foi a seguinte:

  • Athlon 64 X2 4800:          73 FPS
  • Phenom 9700:                 108 FPS

Mesmo com seus quatro núcleos, o Phenom não foi 100% mais veloz, e sim, 48%. O desempenho não é o dobro porque nesse trabalho de conversão, os quatro núcleos não são utilizados simultaneamente o tempo todo. Programas de multimídia e CODECs otimizados para usar vários núcleos tendem a apresentar ganho maior. É preciso levar isso em conta antes da decisão sobre a compra de um processador de quatro núcleos. Não necessariamente tudo ficará de duas a quatro vezes mais rápido.

Comparando com o Core 2 Quad Q6600

Não temos disponível para comparação, o Core 2 Quad Q6600. Seria uma comparação interessante, pois esta CPU Intel é formada por quatro núcleos de 2.4 GHz, assim como o Phenom 9700. As principais características dos dois processadores são:

  Phenom 9700 Core 2 Quad Q6600
Núcleos 4 4
Clock interno 2.4 GHz 2.4 GHz
Cache L2 2 MB (4 x 512 kB) 8 MB
Cache L3 2 MB

Como são processadores completamente diferentes, é difícil dizer que são concorrentes diretos. A cache L2 do Core 2 Quad Q6600 é duas vezes maior que o conjunto L2+L3 do Phenom 9700. Ambos os processadores entretanto possuem quatro núcleos de 2.4 GHz. Não significa necessariamente que os desempenhos devem ser iguais. Durante muito tempo, processadores Intel (Pentium 4) precisavam ter clocks muito mais elevados para competir com modelos da AMD. Atualmente, os desempenhos são parecidos, quando comparamos processadores com mesmo clock de ambos os fabricantes.

Como não temos o Core 2 Quad para medir seu desempenho, usamos os resultados do Tom’s Hardware Guide, em CPU Charts. São os seguintes:

  Phenom 9700 Core 2 Quad Q6600
PCMark2005 CPU 7092 7753
DIVX 6.61 1 min 36s 1 min 30s

O Core 2 Quad apresentou desempenho 9% maior no PCMark2005. O teste de conversão de vídeo com o DIVX usa a versão 6.61, e dá o resultado em tempo, não em FPS. No teste do Tom’s Hardware Guide, o Core 2 Quad foi cerca de 7% mais rápido. Na maioria dos testes apresentados no Tom’s Hardware Guide, o Core 2 Quad Q6600 ganhou do Phenom 9700 por margens entre 5% e 15%. Em muitos deles, é verdade, a margem foi bem pequena. Se levarmos em conta somente o desempenho do processador, este modelo do Phenom precisaria ter um preço de 10 a 15% mais baixo que o do Core 2 Quad Q6600. Isso poderá não ocorrer num primeiro momento, já que o Phenom é um processador novo, e o Core 2 Quad já tem mais de um ano. A médio prazo o produto da AMD poderá ter seu preço reduzido e ser uma opção interessante. Mas preço é uma questão complicada. Preços estão sempre mudando, e não vale a pena fazer uma análise de custo/benefício quando o custo pode mudar de uma semana para outra.

Performance do Phenom a 2.6 e a 2.8 GHz

Como o Phenom testado é uma amostra de engenharia, de 2.6 GHz, reduzimos o seu clock interno no CMOS Setup para 2.4 GHz, ficando similar ao Phenom 9700, que é um produto já existente. Obviamente com clock de 2.6 GHz, o desempenho será maior. Fizemos todas as medidas também com o seu clock normal de 2.6 GHz, e com 2.8 GHz através de overclock. Os resultados são apresentados na tabela abaixo.

Se levarmos em conta somente o aumento de clock, 2.6 GHz é 8,3% maior que 2,4 GHz, e 2,8 GHz é 16,6% maior que 2,4 GHz. Vimos no passado recente, processadores que exibiam aumentos de performance menores que os aumentos nos valores dos seus clocks internos. Por exemplo, um processador Pentium 4 de 2.0 GHz não era 25% mais veloz que um Pentium 4 de 1.6 GHz. O aumento de performance sofria uma saturação, pois existiam outros “gargalos” no sistema que impediam que a performance “escalasse” com o aumento de clock. Limitações na velocidade da memória, no tamanho e velocidade da cache L2 acabavam atrapalhando o aumento de desempenho.

    2.4 GHz 2.6 GHz 2.8 GHz
1 Compactação de arquivos 10,962 MB/s 11,811 MB/s (7,7%) 12,662 MB/s (15,5%)
2 Descompactação de arquivos 142,791 MB/s 154,007 MB/s (7,8%) 165,438 MB/s (15,8%)
3 Encriptação de arquivos 62,363 MB/s 68,229 MB/s (9,4%) 73,538 MB/s (17,9%)
4 Decriptação de arquivos 54,210 MB/s 58,722 MB/s (8,3%) 63,192 MB/s (16,5%)
5 Descompressão de imagem 29,672 Mp/s 32,118 Mp/s (8,2%) 34,553 Mp/s (16,4%)
6 Compressão de áudio 2777 kB/s 3009 kB/s (8,3%) 3241 kB/s (16,7%)
         
7A Compactação de arquivos 11,093 MB/s 11,893 MB/s (7,2%) 12,917 MB/s (16,4%)
7B Encriptação de arquivos 63,123 MB/s 67,933 MB/s (7,6%) 73,406 MB/s (16,3%)
         
8A Descompactação de arquivos 144,587 MB/s 156,062 MB/s (7,9%) 167,542 MB/s (15,8%)
8B Decriptação de arquivos 53,737 MB/s 58,261 MB/s (8,4%) 61,564 MB/s (14,5%)
8C Descompressão de áudio 2288 kB/s 2487 kB/s (8,7%) 2666 kB/s (16,5%)
8D Descompressão de imagem 29,705 Mp/s 31,999 Mp/s (7,7%) 34,942 MB/s (17,6%)
         
  TOTAL 7044 7616 (8,1%) 8196 (16,3%)
         
  DIVX 6.8 108 FPS 115 FPS (6,4%) 122 FPS (12,9%)

Na tabela acima, mostramos os índices obtidos nos diversos testes com o Phenom operando a 2.4, 2.6 e 2.8 GHz. Nos testes a 2.6 GHz, vimos que praticamente todas as medidas ficaram em torno de 8,1% maiores, enquanto nos testes a 2,8 GHz as medidas tiveram aumentos de 16,3%, em média. Como os únicos aumentos aplicados foram o clock do processador (e o conseqüente aumento nas velocidades das caches), concluímos que o desempenho praticamente “escalou” com este aumento de clock. Significa ainda que o fato da memória nos três casos ser DDR2/800 (não usamos DDR2/1066), o desempenho da memória não está sendo um “gargalo” sério para o sistema. Ou seja, tudo indica que a arquitetura K10 tem condições de apresentar aumentos de desempenho equivalentes aos aumentos de clock que virão nos próximos anos.

O único resultado discrepante foi a taxa de conversão feita com o DIVX. Os aumentos de desempenho foram menores que os aumentos de clock. Durante os testes observamos com o Gerenciador de tarefas do Windows XP que os núcleos não estavam 100% utilizados, e sim, de 60% a 70% ocupados. Por outro lado, os testes com quatro núcleos operando simultaneamente feitos com o PCMark2005 mostraram aumentos de desempenho similares aos aumentos de clock. Isto significa que usar os programas FlaskMPEG e DIVX pode não ser uma boa forma de avaliar o desempenho dos processadores modernos. A taxa de conversão tornou-se tão elevada que o tempo de leitura e gravação no disco passou a pesar no resultado final. É preciso usar nos próximos testes, programas de codificação de vídeo que aproveitem melhor os núcleos disponíveis.

Aquecimento

Os primeiros modelos do Phenom usam a tecnologia de fabricação AMD de 65 nm. A Intel já introduziu a tecnologia de 45 nm no final de 2007, a AMD deverá fazê-lo no final de 2008. Devido ao seu número incrível de transistores (460 milhões), o aquecimento do Phenom é grande. Os modelos 9500 e 9600 dissipam 95 watts, e os modelos seguintes, com clocks maiores, terão consumo maior. Assim como tem ocorrido com gerações anteriores, novos modelos apresentarão dissipação menor, mesmo mantendo o mesmo processo de fabricação. Com a chegada do novo processo de 45 nm o fabricante pode optar por manter clock e caches, e reduzir o consumo, ou manter o consumo e lançar modelos com maiores caches e clocks mais elevados.

O modelo testado é uma amostra de engenharia com clock de 2.6 GHz, mas corresponde a um futuro modelo comercial que será lançado em abril/2008. Seu consumo elétrico é 125 watts.
Figura 13 – Cooler Thermaltake modelo K450

Usamos um cooler disponível no nosso laboratório, um Thermaltake modelo K450. Este cooler foi originalmente utilizado em um sistema com um processador Athlon 64 X2 4800 que dissipava 110 watts. Apesar de ser um cooler relativamente antigo, serve para o Phenom, já que o soquete tem dimensões semelhantes, e a dissipação de calor atinge níveis parecidos. O Athlon 64 X2 que dissipava 110 watts ficava com a temperatura bem baixa com o uso desse cooler. Os testes mostraram que também foi bem adequado ao Phenom, mesmo com os seus 125 watts dissipados.

É claro que com processadores com consumo elétrico tão elevado, não devemos confiar somente no cooler do processador. Outras providências que reduzem a temperatura do sistema são:

  • Gabinete com duto lateral de ventilação para o processador
  • Fonte de alimentação com ventilador interno
  • Ventilador instalado na parte traseira do gabinete, expulsando o ar quente

No sistema testado, usamos esses três métodos de refrigeração simultaneamente.
Figura 14 – Sistema de ventilação

Fizemos testes de temperatura com o processador operando na sua velocidade normal (2.6 GHz). Medimos as temperaturas em repouso e em alta atividade, executando testes usando os quatro núcleos, com o programa PCMark2005. O ambiente externo foi mantido a 25°C. As tabelas abaixo mostram os resultados.

Em repouso                                                    Em processamento intensivo

Ponto de medida Temperatura   Ponto de medida Temperatura  
Ambiente 25°C   Ambiente 25°C  
Gabinete 44°C   Gabinete 45°C  
Processador 52°C   Processador 59°C  

Antes de mais nada é preciso comentar a temperatura interna do gabinete. Um bom resultado em um sistema de refrigeração de gabinete é conseguir que o seu interior fique 10°C mais quente que o ambiente externo. No nosso caso, ficou de 19°C a 20°C mais quente que o ambiente. Seria preciso melhorar a refrigeração interna do gabinete, não adicionando mais ventiladores, mas remanejando obstáculos que atrapalham o fluxo de ar. No caso deveríamos arrumar os cabos internos, principalmente os vários cabos que partem da fonte de alimentação, já que o modelo usado nos nossos testes tem mais conectores que uma fonte comum. A placa de vídeo, apesar de transferir todo o seu calor para fora do gabinete, estava alinhada com o disco rígido, formando uma parede que bloqueava a entrada de ar vinda da parte frontal do gabinete. Como é apenas um sistema de testes, sem objetivo de otimizar a refrigeração, deixamos tudo como estava. Ainda assim, o duto lateral para entrada de ar ajudava a manter o processador com temperatura razoavelmente baixa: 52°C em repouso e 59°C em máxima atividade.

Fizemos também testes com um cooler simples da AMD, que acompanha processadores Athlon com consumo elétrico de 89 watts. Com ele o processador chegou a 65°C em máxima atividade. É preciso portanto usar um bom cooler para evitar aquecimento excessivo.

O assunto não termina…

Já apresentamos várias informações sobre o Phenom, mas o assunto não termina. Um imenso artigo considerado completo deveria abordar ainda:

Funcionamento interno da arquitetura K10
Mais detalhes técnicos sobre o Socket AM2+
Descrição detalhada da plataforma Spider
Testes de desempenho usando múltiplas placas de vídeo, no padrão CrossfireX
Testes de overclock
Programa AMD Overdrive, para fazer overclock dentro do Windows

É hora de saber quando parar e publicar. É melhor liberar este artigo, que já traz muitas informações. Outros artigos serão publicados posteriormente.

Conclusões

Sem competição os preços são sempre elevados. Até agora a Intel tinha uma certa liberdade para definir os preços dos seus processadores de quatro núcleos. O recém chegado Phenom podem mudar bastante o panorama. O Phenom não tem condições neste primeiro momento de desbancar os processadores de quatro núcleos da Intel, existentes há mais de um ano, em preço e performance. Melhoramentos típicos dos processos de produção permitirão nos próximos meses reduzir o custo e o consumo elétrico, viabilizando modelos com clocks mais elevados. O Phenom está recém chegado no Brasil, são poucos os exemplos de preços praticados no comércio local. É bom prestar muita atenção.