Home » Artigos arquivados » Phenom II X6 1090T

Phenom II X6 1090T

Autor: Laércio Vasconcelos
Data: 03/11/2010

Sinopse:
Os novos processadores AMD têm agora 6 núcleos. Ao contrário dos lançamentos dos últimos anos, nos quais o mais avançado era sempre bastante caro, esses processadores de 6 núcleos apresentam preços bem acessíveis para um computador de custo moderado.

Os mais avançados processadores da Intel e da AMD têm agora 6 núcleos. A AMD usa oficialmente o termo “six-core”, mas é comum encontrar entre os usuários, referências como “hexacore” ou “hex-core”, todas são aceitas. Antes dos novos processadores, o modelo mais avançado da AMD era o Phenom II X4 modelo 965, de 3,4 GHz. Os novos modelos de 6 núcleos são oferecidos com as velocidades de 2.8 e 3.2 GHz, e trazem uma novidade, o recurso “Turbo Core”, em resposta ao Turbo Boost da Intel.

f02-01

Figura 1 – Phenom II X6 de 3.2 GHz, modelo HDT90ZFBK6DGR

A AMD enviou para testes um modelo comercial de 3,2 GHz, ao contrário das amostras de engenharia comuns em reviews. São os seguintes os primeiros modelos lançados. Os preços citados são os médios das lojas do Centro do Rio de Janeiro, que constam no site www.boadica.com.br.

Modelo Part # Clock Temp Máx Potência Preço
1090T HDT90ZFBGRBOX 3.2 GHz 62°C 125 W R$ 780,00
1055T HDT55TFBGRBOX 2.8 GHz 62°C 125 W R$ 560,00
1055T HDT55TWFGRBOX 2.8 GHz 71°C 95 W R$ 560,00

Tabela 1: Modelos do Phenom II X6

Os três modelos possuem as seguintes características comuns:

HyperTransport 4000 MHz
Cache L1 128 kB x6
Cache L2 512 kB x6
Cache L3 6 MB
Soquete AM3
Processo 45 nm

Tabela 2: Características do Phenom II X6

Note que existem dois modelos 1055T (2.8 MHz). O segundo deles mostrado na tabela (HDT55TWFGRBOX) leva duas vantagens sobre o primeiro: Dissipa apenas 95 watts, contra 125 watts do outro, e suporta temperatura máxima de 71°C, contra apenas 62°C do outro. Para quem está interessado neste processador, é bom anotar este código para checar na ocasião da compra.

Observe ainda que o modelo de 3.2 GHz é “Black Edition”, ou seja, suporta programação do seu multiplicador interno por software, o que é muito útil para quem pretende fazer overclock.

Preço e performance

O Phenom X6 é uma opção interessante para quem usa muitas aplicações que sejam beneficiadas por múltiplos núcleos. As principais são edição de vídeo e geração de conteúdo de multimídia. Nem sempre é o caso dos jogos, já que a maioria deles opera bem com dois núcleos, e são muito mais beneficiados por uma placa de vídeo veloz que por um super processador. As opções de 6 núcleos da Intel (Core i7 Extreme 980X e 970X) ainda são muito caras. A AMD ainda não consegue competir com esses processadores mais velozes da Intel, pois ainda usa o processo de 45 nm. Os modelos mais novos da Intel já usam 32 nm. Esse problema resulta em limitações de compromisso entre clock, potência máxima e custo. Ainda assim, os modelos mais avançados da AMD apresentam boa relação custo-benefício se comparados com os modelos de quatro núcleos da Intel, ou seja, dada uma quantia fixa, é quase sempre possível conseguir um processador mais rápido da AMD que se fosse escolhido um modelo da Intel.

hard-13

Figura 2 – Pastilha de silício do Phenom II X6

A figura 2 mostra o die do Phenom II X6. Nele podemos identificar facilmente os seis núcleos, cada um com sua cache L2 de 512 MB, e a grande área à direita, que corresponde à cache L3 de 6 MB, compartilhada entre os núcleos.

Em relação aos jogos, podemos constatar que muitos deles, mesmo modernos, operam bem com um ou dois núcleos. As razões são óbvias: os desenvolvedores de jogos sofrem duas pressões de lados opostos. De um lado, querem melhorar o realismo gráfico. De outro lado, querem que seus produtos possam ser usados na maioria dos computadores avançados. Muitos deles possuem processadores de dois núcleos, não podemos ainda considerar os processadores de quatro núcleos como populares. Já as placas de vídeo velozes são bem mais comuns. Por isso a maioria dos benchmarks publicados sobre desempenho para processadores diferentes apresenta variações pequenas em função do processador, como o benchmark do GTA 4 publicado no Toms’s Hardware Guide.

f02-03

Figura 3 – Na maioria dos casos, o desempenho em jogos depende mais da placa de vídeo que do processador (GTA 4).

Sabemos que para a maioria dos jogos, o desempenho para execução de jogos 3D é mais influenciado pela placa de vídeo que pelo processador. Existem algumas exceções, como os jogos que usam intensamente inteligência artificial e física de movimentos, o que deixa o processador mais ocupado.

f02-04

Figura 4 – Em alguns casos o desempenho do processador afeta mais o desempenho 3D (Far Cry)

Como os processadores de 6 núcleos são hoje considerados “topo de linha”, a maioria dos jogos ainda levam em conta que podem usar na média, entre 2 e 4 núcleos. A figura 5 mostra o gráfico de uso da CPU durante a execução do jogo DIRT 2 durante uma corrida. Observamos que todos os núcleos foram usados, mas a soma das taxas de utilização ficou em torno de 300%, portanto tenderia a usar 3 núcleos ao máximo. Podemos considerar que um processador de 6 núcleos tem plenas condições para executar com eficiência os jogos mais avançados atuais e a nova geração dos próximos anos.

f02-05

Figura 5 – Uso dos núcleos em um Phenom X6 pelo jogo DIRT2 (CLIQUE PARA AUMENTAR)

Não podemos estabelecer uma regra geral infalível entre desempenho 3D, placa de vídeo e processador. Na maioria dos casos, o trabalho maior é da placa de vídeo, portanto seria melhor comprar um processador moderado e gastar mais em uma placa de vídeo mais avançada. Em alguns casos, o processador mais avançado será mais aproveitado. Cada um é responsável por descobrir a demanda de CPU dos seus jogos prediletos para decidir se investe em um processador mais avançado, ou economiza um pouco aqui para comprar uma placa de vídeo melhor. Uma coisa é certa, em qualquer caso: uma placa de vídeo avançada sempre será um bom investimento para quem gosta de jogos 3D. Um processador super avançado e caro nem sempre será um bom investimento.

Turbo Boost e Turbo Core

Quando todos os núcleos estão operando com carga de trabalho de 100%, o processador atinge seu máximo valor de potência elétrica, ou seja, é máximo o seu aquecimento. Como sabemos, são dois os fatores que limitam o clock máximo de um processador: estabilidade em altas freqüências e dissipação de calor. O uso de coolers avançados é a solução para o problema do calor, mas ainda existe a questão do correto funcionamento dos circuitos em altas freqüências. Os núcleos dos processadores AMD atuais podem funcionar com até 3,6 GHz, e em alguns casos até 4.0 GHz. O problema é que quando todos os núcleos operam com essa velocidade, o processador fica muito quente e pode “fritar”, apesar dos circuitos internos terem tempo de resposta suficientemente rápido para operar corretamente nessas velocidades, se não fosse o problema do calor.

O Turbo Core é um recurso introduzido pela AMD no Phenom X6 que já estava presente nos modelos de 6 núcleos do Core i7 Extreme. Quando três ou mais núcleos estão com baixa carga de trabalho (e portanto, gerando pouco calor), os núcleos restantes (1, 2 ou 3) poderão aumentar seu clock (e aquecer mais) sem entretanto ultrapassar a máxima potência permitida. Esse aumento é feito dinamicamente, de forma automática. Os modelos de 2.8 GHz terão seu clock aumentado para 3.2 GHz, e os modelos de 3.2 GHz terão o clock aumentado para 3.6 GHz. A partir do momento em que existem quatro núcleos com utilização intensa (o mesmo vale para 5 ou 6), o Turbo Core é desativado momentaneamente, e o clock volta ao seu valor normal. Isso resulta em um aumento de desempenho de pouco mais que 10% nas aplicações que exigem no máximo três núcleos. Podemos considerar este recurso como uma espécie de overclock oficial controlado.

Dificuldades com o novo processador

Tivemos algumas dificuldades (solucionadas de forma simples) com este novo processador. São dificuldades típicas que ocorrem quando é instalado um novo processador em uma placa mãe já existente. Antes de testar o Phenom II X6, montamos um sistema para testar o Phenom II X4, baseado na placa mãe MSI 790GX-G65. Com a chegada do novo processador, bastaria fazer a substituição e repetir os testes de benchmark. Foi necessário fazer uma atualização de BIOS e instalar o driver do processador (apenas para testes sob o Windows XP, pois o Windows 7 já tem driver de processador apropriado). Sem fazer a atualização de BIOS, o processador era reportado como um modelo desconhecido. A placa mãe reduzia automaticamente a velocidade do processador para 800 MHz.

f02-06

Figura 6 – Sem atualizar o BIOS, nem o Windows 7 mostra o processador corretamente

A princípio não notamos problema no fato do Gerenciador de dispositivos do Windows 7 ter mostrado o processador como “model unknown” (figura 6), pois isso é comum nas amostras de engenharia. Entretanto, o processador que recebemos não era uma amostra de engenharia, mas um modelo comercial. O Windows precisa de alguma informação do BIOS a respeito do processador para reconhecê-lo corretamente e usar seus recursos. Depois da atualização do BIOS, o processador passou a ser reconhecido corretamente no Windows 7. O problema não ocorria com a placa Asus CrossHair, enviada pela AMD junto com o processador, pois seu BIOS já estava atualizado.

Outra dificuldade encontrada no sistema com a placa MSI foi uma queda de desempenho em comparação com o Phenom II X4 965 nas aplicações que usam até 4 núcleos. Este Phenom II X4 tem clock de 3.4 GHz. O Phenom II X6 tem clock de 3.2 GHz, mas nas aplicações para até 3 núcleos, o clock é aumentado para 3,6 GHz graças ao Turbo Core, o que resultaria em um aumento de desempenho de aproximadamente 5% para essas aplicações. O que ocorreu entretanto foi o contrário: o desempenho diminuiu 9% ao invés de aumentar 5%, nas aplicações com 1 ou 2 núcleos. Para fazer essas comparações, usamos valores obtidos em review anterior, baseado no programa PCMark 2005, que analisa processadores de até 4 núcleos. Ocorre que este programa opera sob o Windows XP, e por isso tivemos que usar este sistema. O driver de processador que acompanha o Windows XP é de 2004. O Windows 7 já vem com o driver mais novo da AMD para processadores multicore, que é de 2007 (não existe versão mais nova por enquanto). Devido ao uso do driver antigo, o processador teve seu desempenho reduzido, independentemente do BIOS estar atualizado ou não. O problema ocorreu com ambas as placas mãe usadas no teste.

Pior ainda foi o que ocorreu nas medidas que envolviam quatro núcleos. Quando quatro ou mais núcleos do Phenom II X6 estão em plena atividade, o Turbo Core é desligado, fazendo com que seu clock seja reduzido para a velocidade normal, no caso 3.2 GHz. Deveria reduzir em 5%, entretanto a redução no desempenho foi de cerca de 15%. A instalação do “AMD Processor Driver” de versão mais recente, obtida no site da AMD, resolveu os problemas, e as medidas de desempenho passaram a apresentar os valores esperados.

O computador com o Phenom X6 também apresentou problemas de desligamento enquanto não era feita a atualização de BIOS e a instalação do driver do processador. O micro simplesmente não desligava com o comando normal de desligamento do Windows, mesmo esperando vários minutos. Era preciso desligar “na marra” (chave power ou pressionar o botão Power por mais de 4 segundos). Com a atualização de BIOS e de driver, o problema foi resolvido.

Tudo isso confirma a importância de regras cruciais em upgrade: verificar no site do fabricante da placa mãe se é necessário fazer uma atualização de BIOS, verificar se a placa mãe suporta o novo processador, e verificar se é necessário atualizar o driver do processador.

Comparação com o X4

Sempre que é lançado um novo processador é importante fazer a sua comparação com modelos da geração anterior. Existem alguns casos históricos de modelos novos que eram piores que os anteriores:

AMD K6-2/550 era só 30% mais rápido que o K6-2/300

Pentium 4 era mais lento que o Pentium III de mesmo clock

Pentium 4 Prescott tinha o mesmo desempenho do Pentium 4 Northwood de mesmo clock

Especificamente nos testes com o Phenom, temos testado se a geração nova trazia vantagens em relação à anterior. Não gostaríamos de ver coisas do tipo “é mais lento que o anterior quando usa dois núcleos, mais quando usa todos os núcleos é bem veloz…”. No nosso primeiro artigo sobre o Phenom, feito no seu lançamento, mostramos que é bem mais veloz nas aplicações para um ou dois núcleos em comparação com o Athlon 64 X2 de mesmo clock. Nas aplicações para quatro núcleos, o desempenho mais que dobra, em comparação com o uso de dois núcleos. Quando analisamos o Phenom II X4, mostramos que é sensivelmente mais veloz que o Phenom X4 de mesmo clock.

Agora, ao analisar o Phenom II X6, precisamos responder duas perguntas importantes:

1) Nas aplicações que usam até 4 núcleos, o Phenom II X6 tem desempenho maior ou igual ao do X4? A resposta é SIM, totalmente, como mostraremos a seguir.

2) Nas aplicações que usam 6 núcleos, o Phenom II X6 é 50% mais rápido (6 contra 4) que o Phenom II X4 de mesmo clock? A resposta é SIM, porém ainda são poucas as aplicações que tiram o máximo proveito de todos os núcleos do processador. As principais aplicações que aproveitam todos os núcleos são as que lidam com codificação de vídeo.

Comparação com o X4, usando até 4 núcleos

O Phenom II X6 é realmente um processador superior ao Phenom II X4 de mesmo clock. Tomemos como exemplo o Phenom II X4 mais veloz, que é o modelo 965, de 3.4 GHz, e o Phenom II X6 mais veloz até o momento, que é o modelo 1090T, de 3.2 GHz. Graças ao Turbo Core, o X6 tem seu clock aumentado automaticamente para 3,6 GHz em aplicações que usam até 3 núcleos, o que de certa forma tornaria a comparação injusta. Vejamos os resultados dos benchmarks realizados com o programa PCMark 2005, sob o Windows XP. A versão mais nova deste programa é o PCMark Vantage, que roda sob Windows Vista e Windows 7, porém não apresenta resultados tão detalhados quanto a versão 2005. Por outro lado, a versão 2005 apresenta testes apenas para processadores de até quatro núcleos. Como nosso objetivo nesse teste é avaliar o desempenho do X6 nas aplicações que usam até 4 núcleos, este é o programa mais indicado. A tabela abaixo mostra os resultados. Os testes foram feitos em uma placa MSI 790GX-G65 com 4 GB de memória DDR3/1600. Testes feitos com memória mais lentas (1333) apresentaram resultados praticamente idênticos, graças à cache L3.

PCMark 2005 CPU

Phenom II X4 965 (4x 3,4 GHz) Phenom II X6 3.2 GHz + Turbo Core Ganho
1 Compactação de arquivos 15,945 MB/s 16,712 MB/s +4,8%
2 Descompactação de arquivos 207,263 MB/s 216,914 MB/s +4,6%
3 Encriptação de arquivos 92,456 MB/s 97,416 MB/s +5,3%
4 Decriptação de arquivos 83,497 MB/s 87,866 MB/s +5,2%
5 Descompressão de imagem 43,964 MP/s 46,550 MP/s +5,9%
6 Compressão de áudio 3947 kB/s 4166 kB/s +5,5%
7A Compactação de arquivos 15,900 MB/s 16,700 MB/s +5,0%
7B Encriptação de arquivos 92,624 MB/s 97,414 MB/s +5,2%
8A Descompactação de arquivos 206,720 MB/s 196,438 MB/s -5,0%
8B Decriptação de arquivos 83,351 MB/s 78,436 MB/s -5,9%
8C Descompressão de áudio 3282 kB/s 3109 MB/s -5,3%
8D Descompressão de imagem 43,764 Mpixels/s 41,435 Mpixels/s -5,3%

 

Tabela 3: Medidas de desempenho com o PCMark 2006 no Phenom II X4 e Phenom II X6

Os resultados foram muito interessantes e dentro do esperado. Nos testes de 1 a 6 (processamento com um núcleo) e 7 (processamento com dois núcleos), o ganho de desempenho foi de cerca de 5,2%. É praticamente igual à proporção entre os clocks (3,6 GHz / 3,4 GHz = 1,059, ou seja, +5,9%).

Nas aplicações que usam quatro núcleos, o Phenom II X6 desativa o Turbo Core e volta a operar com seu clock normal de 3,2 GHz. A queda média de desempenho em relação ao X4 foi de 5,4 %, que é aproximadamente a mesma queda correspondente à proporção entre os clocks (3,2 GHz / 3,4 GHz = 0,941, que corresponde a uma queda de 5,9%). Concluímos que o X6 apresenta ganho de desempenho proporcional à variação de clock, isso comprova a sua escalabilidade, ou seja, termos um desempenho maior na mesma proporção do aumento de clock. Parece algo óbvio, mas é bom sempre conferir essas medidas nos novos processadores devido ao histórico de “inflação de GHz” (aumento de desempenho não acompanhava o aumento de clock). ocorrida em alguns casos nos últimos anos.

Com 5 núcleos em uso, o ganho de desempenho será hipoteticamente 25%, e com 6 núcleos será também hipoteticamente 50%, como checaremos mais adiante. Portanto o Phenom X6 de 3,2 GHz, em comparação com o Phenom X4 de 3,4 GHz apresentará ganhos de cerca de 5% quando operar com até 3 núcleos, queda de 5% ao operar com 4 núcleos, e ganhos de 25% e 50% ao operar com 5 ou 6 núcleos.

Note que esses são resultados de um benchmark sintético. Na prática cenários diferentes podem ocorrer. Se usaremos por exemplo um disco rígido lento, pouca memória ou no caso de jogos, uma placa 3D simples, os resultados serão comprometidos. Não haverá diferença entre os dois processadores nas operações que envolvem o uso da Internet, pois o fator limitante nesse caso é a velocidade da conexão, não do processador.

Ainda saindo dos limites das análises sintéticas, o processamento no mundo real com 6 núcleos poderá ser mais vantajoso que com 4 núcleos. Considere a realização de duas tarefas pesadas: codificação de múltiplos arquivos de vídeo e o uso de um jogo 3D pesado. Usamos no nosso teste o jogo DIRT2, considerado um dos mais pesados em termos de gráficos e de uso do processador. Medidas feitas com o Gerenciador de Tarefas do Windows 7 mostraram que este jogo usa somente dois núcleos do processador, mesmo que existam mais núcleos disponíveis. Suponha que você vai usar este jogo ao mesmo tempo em que faz uma codificação de múltiplos arquivos de vídeo (por exemplo, converter múltiplos arquivos AVI, WMV, MOV e outros para formato de iPOD). Se o jogo está usando 2 núcleos, um Phenom X4 ficará com dois núcleos disponíveis para fazer a conversão de vídeo, enquanto o Phenom X6 ficará com 4 núcleos disponíveis para o mesmo trabalho. Leve em conta que outros jogos modernos poderão usar mais núcleos, daí seria maior ainda a vantagem em usar um modelo X6 ao invés de um modelo X6. Note que estamos fazendo análises com o Phenom, mas princípio semelhante se aplica aos modelos da Intel. O problema é que os modelos de 6 núcleos da Intel são muito mais caros, e os núcleos HT não são reais e não aumentam o desempenho. Um Core i7 com 4 núcleos HT não é equivalente a um processador de 8 núcleos, vamos considerar que seja equivalente a um de 5 núcleos, levando em conta um aumento de 25% no desempenho graças aos “núcleos virtuais” do HT. A análise de desempenho x núcleos nos processadores Intel é assunto interessante para outro artigo.

Voltando à comparação com o X4, fizemos também testes sem o Turbo Core, que seriam mais “justos”. Desativamos o Turbo Core no CMOS Setup, o que deixaria os núcleos do X6 operando a 3.2 GHz em qualquer caso. Como o X4 do nosso teste é de 3.4 GHz, seria mais justo reduzir seu clock para 3,2 GHz para ficar igual ao do X6. Optamos por manter o X4 a 3.4 GHz e aumentar o clock do X6 para 3.4 GHz pelo CMOS Setup, o que é permitido pois trata-se de um modelo Black Edition. Aqui estão os resultados obtidos, com ambos a 3,4 GHz:

Phenom II X4 965 (4x 3,4 GHz) Phenom II X6 @ 3.4 GHz sem Turbo Core Ganho
1 Compactação de arquivos 15,945 MB/s 15,832 MB/s -0,7%
2 Descompactação de arquivos 207,263 MB/s 207,958 MB/s +0,3%
3 Encriptação de arquivos 92,456 MB/s 92,172 MB/s -0,3%
4 Decriptação de arquivos 83,497 MB/s 83,562 MB/s -0,08%
5 Descompressão de imagem 43,964 MP/s 43,992 MP/s +0,06%
6 Compressão de áudio 3947 kB/s 3950 kB/s +0,07%
7A Compactação de arquivos 15,900 MB/s 15,811 MB/s -0,6%
7B Encriptação de arquivos 92,624 MB/s 92.127 MB/s -0,5%
8A Descompactação de arquivos 206,720 MB/s 207.876 MB/s +0,5%
8B Decriptação de arquivos 83,351 MB/s 83.489 MB/s +0,2%
8C Descompressão de áudio 3282 kB/s 3293 kB/s +0,3%
8D Descompressão de imagem 43,764 Mpixels/s 44.034 Mpixels/s +0,6%

 

Tabela 4: Medidas de desempenho com o PCMark 2006 no Phenom II X5 e Phenom II X6

As diferenças obtidas foram inferiores a 1%, para mais ou para menos, usando sistemas idênticos. Podemos então considerar que a AMD não “estragou” o X4 com overhead na sua arquitetura ao desenvolver o modelo de 6 núcleos.

Falta agora mostrar o ganho obtido com 6 núcleos em comparação com o modelo de 4 núcleos nas aplicações que aproveitam todos os núcleos. Façamos inicialmente as medidas de desempenho com o programa PCMark Vantage sob o Windows 7.

6 núcleos contra 4 núcleos

Infelizmente a maioria dos programas atuais não estão otimizados para aproveitar 6 núcleos. Na verdade muitos deles nem mesmo chegam a aproveitar 4 núcleos com todo o seu potencial. Isso era diferente na época do lançamento dos primeiros processadores de dois núcleos. Graças ao lançamento do Hyper-Threading, dois anos antes, os fabricantes de software tiveram tempo para otimizar seus programas. Quando chegaram os processadores de dois núcleos, a maioria deles conseguiu dobrar ou quase dobrar o desempenho nas aplicações mais beneficiadas pela velocidade do processador, como o processamento de imagem, vídeo e áudio, sobretudo os CODECs de vídeo. Hoje isso nem sempre é verdade. Para aproveitar melhor os vários núcleos do processador é preciso instalar versões mais novas dos programas, ou esperar pelas versões otimizadas.

Veja por exemplo o caso do programa XiliSoft Vídeo Converter Ultimate. Esse programa converte vídeos entre formatos diferentes. Por exemplo, podemos baixar arquivos WMV, RMVB, AVI ou mesmo usar arquivos VOB de DVDs, e convertê-los para praticamente qualquer formato existente. Fizemos um teste convertendo 270 arquivos AVI codificados em DIVX 6.8, todos com resolução de 640×480, para formato 320×240 codificados em H.264, compatível com iPOD. As conversões foram feitas na mesma máquina, mas usando dois processadores diferentes:

Phenom II X4 965, 3.4 GHz 9 min 20s
Phenom II X6, 3.2 GHz 8 min 30s

 

Tabela 5: Nesta tarefa o X6 teve pequena vantagem sobre o X4

Como o Video Converter Ultimate pode usar todos os núcleos do processador, deveria fazer o trabalho de conversão com uma velocidade 50% maior com 6 núcleos que com o uso de 4 núcleos. Ao invés de 9 minutos, deveria operar na faixa de 6 minutos, entretanto o tempo total de conversão foi de 8 minutos e meio. O motivo da discrepância é que este programa, assim como a maioria deles, não usa plenamente todos os núcleos do processador, como podemos aferir com o Gerenciador de Tarefas.

f02-07

Figura 7 – Programa não usa totalmente os núcleos do processador. (CLIQUE PARA AUMENTAR)

O histórico de uso do processador durante a execução dos programas apresentou uma utilização média de 70% em cada núcleo. Daí vem a diferença pequena no desempenho com 4 e com 6 núcleos.

Mais uma vez lembramos que essa análise se aplica ao caso de um só programa “pesado” usando todos os núcleos do processador. Em um cenário mais comum, podemos ter dois ou mais programas pesados. Com mais núcleos disponíveis, um sistema com 6 núcleos levaria vantagem sobre um sistema com 4 núcleos, independentemente dos programas utilizados.

f02-08

Figura 8 – Conversão de DVD para AVI com FlaskMPEG e DIVX 7.0

A figura 8 mostra medidas de utilização dos núcleos do Phenom X6 durante uma conversão de vídeo (DVD para AVI com os programas FlaskMPEG e DIVX 7.0). Nesse tipo de conversão, a maior parte do trabalho cabe ao DIVX, que faz a codificação, tarefa que é muito mais pesada que a decodificação dos arquivos MPEG-2 do DVD. Para a medida ser justa, temos que descartar a lenta operação de leitura do DVD. Por isso antes de iniciar a conversão, fizemos a cópia do conteúdo do DVD para o disco rígido usando o programa DVD Decrypter. Observe que a taxa de utilização do processador não chega a 100%, fica com a média de 80%, ou seja, o programa não é totalmente otimizado para usar todos os núcleos do processador ao máximo, por isso não podemos obter um o ganho máximo teórico para uso de 6 núcleos contra 4 núcleos, que seria +50% (considerando clocks iguais).

Codificação de vídeo com o Handbrake

Já sabemos que nem todos os programas pesados aproveitam todos os núcleos do processador. Também sabemos que, mesmo entre os que usam todos os núcleos disponíveis, nem sempre são otimizados para que seu uso seja 100%, o que resultaria na maior velocidade. Devemos levar em conta que quando usamos certos programas pesados como codificadores de vídeo, nem sempre desejamos deixar o computador voltado apenas para esta tarefa, e sim, continuar a usá-lo normalmente enquanto a conversão é feita em segundo plano. Talvez por isso os fabricantes de programas nem sempre dão prioridade a usar todos os núcleos do processador ao extremo. Seja como for, seria muito bom testar um programa que use ao extremo os núcleos do processador para checar se o modelo de 6 núcleos “escala” em comparação com o modelo de 4 núcleos, ou seja, se o ganho de performance é proporcional ao aumento de clock e ao aumento do número de núcleos. Para um programa que obedeça esta regra, o ganho de performance obtido em um Phenom II X6 em comparação com um Phenom II X4 deveria ser igual a:

Ganho = (clock do x6 x 6) / (clock do x4 x 4)

Comparando o Phenom II X6 de 3.2 GHz com o Phenom II X4 de 3.4 GHz ficaria:

(3.2 x 6) / (3.4 x 4) = 1,41, ou seja, 41% mais veloz

Seria 50% mais veloz se ambos os processadores operassem com o mesmo clock.

Usamos para verificar o ganho de performance com o uso dos 6 núcleos o programa Handbrake, obtido em http://handbrake.fr. Este programa é um conversor de vídeo gratuito. Não é um conversor universal. Aceita vários formatos de arquivos de vídeo como entrada, mas gera apenas arquivos de saída nos formatos MP4 e MKV.

f02-09

Figura 9 – Medida de desempenho com o programa HandBrake (CLIQUE PARA AUMENTAR)

Nosso teste é mostrado na figura 9. Fizemos a conversão de um arquivo AVI com duas horas de duração e 6000kbps (5,8 GB) e resolução de 720×480. O arquivo gerado tem formato MP4. Note que o gerenciador de tarefas mostra ao longo do tempo, uma taxa de utilização de quase 100% para os seis núcleos. É mostrada na janela de CMD.EXE acima a taxa instantânea e a taxa média de conversão. A média ficou em 159 fps com 6 núcleos. Fizemos as mesmas medidas com 6 núcleos (3.2 GHz) e com 4 núcleos (3.4 GHz) e foram obtidos os seguintes resultados:

Phenom II X4 965, 3.4 GHz 115 fps
Phenom II X6, 3.2 GHz 159 fps

Tabela 6: X6 teve ganho de 38%

O ganho observado foi:

159 / 115 = 1,38, ou seja, 38% mais veloz

É um resultado bem próximo dos 41% teóricos. O fato de não ter sido alcançado o resultado esperado (41%) pode ter várias explicações:

a) O programa não está totalmente otimizado para os 6 núcleos

b) O fato da cache L3 ser 6 MB nos dois casos pode prejudicar a escalabilidade

c) O tempo gasto na leitura do arquivo de entrada pode afetar o resultado

O tempo gasto na leitura de um arquivo a ser convertido pode afetar o desempenho total, caso este arquivo seja grande. No teste realizado, o tempo total de conversão foi dd 20 minutos. Como o arquivo tem quase 6 GB, seria gasto cerca de um minuto na sua leitura, supondo uma taxa efetiva de 100 MB/s. De fato, somente a operação de cópia deste arquivo a partir de um HD externo demorou 3 minutos. Isso nos motivou a repetir a medida usando um arquivo de vídeo menor. Dessa vez escolhemos um filme com 1 hora e meia de duração, resolução de 640×480 e 700 MB. Os testes de conversão deste arquivo para MP4 foram feitos duas vezes, no mesmo computador, inicialmente com um Phenom II de 4 núcleos, depois com o de 6 núcleos. As medidas em andamento podem ser vistas nas figuras 10 e 11.

f02-10

Figura 10 – Conversão de vídeo no Phenom II X4 (CLIQUE PARA AUMENTAR)

f02-11

Figura 11 – Conversão de vídeo no Phenom II X6 (CLIQUE PARA AUMENTAR)

Nesses testes observamos que a taxa de utilização dos núcleos do processador ficou acima de 97%, o que mostra que o tamanho grande do arquivo de entrada no teste anterior impedia que o processador ficasse 100% do tempo ocupado, já que pesava um pouco o tempo de leitura do arquivo.

Os resultados são resumidos na tabela abaixo:

Phenom II X4 965, 3.4 GHz 140,13 fps
Phenom II X6, 3.2 GHz 197,40 fps

Tabela 7: X6 teve ganho de 40,8%

Ganho = 197,40 / 140,13 = 1,408

O ganho obtido agora foi 1,408, valor praticamente idêntico ao 1,41 calculado de forma teórica. Isso prova que o novo processador realmente escala o seu desempenho com a utilização de todos os núcleos, mas é preciso levar em conta:

1) Programas que usam todos os núcleos devem ser otimizados para aproveitamento máximo. Enquanto os fabricantes não os otimizam, o ganho será inferior ao valor teórico.

2) Mesmo quando programas não foram otimizados, sempre ocorrerá ganho de desempenho quando usamos múltiplos programas pesados simultaneamente.

3) Outras partes do computador também precisam ser rápidas. No exemplo acima, vimos que o tempo gasto na leitura do arquivo do disco rígido afetou o desempenho total. Para o computador ser rápido como um todo, não podemos ter partes causando “gargalos”.

Testes com o PCMark Vantage sob o Windows 7

O PCMark 2005 é um programa antiquado. Tem mais de 5 anos, só funciona sob o Windows XP e não avalia corretamente processadores com mais de 4 núcleos. Apesar disso, suas medidas de desempenho são perfeitamente válidas, e também é um benchmark sintético. Este tipo de benchmark é o mais adequado quando queremos testar individualmente módulos do computador: processador, memória, disco rígido, placa de vídeo. Além dos benchmarks sintéticos, existem também os benchmarks de sistema. Nesse tipo de teste, o resultado final depende não só do processador, mas também do disco rígido, memória e placa de vídeo. Dá uma idéia do desempenho do computador como um todo, mas é ineficiente para avaliar individualmente cada módulo, como o processador, por exemplo.

A versão mais recente de programa de benchmark da Futuremark (produtora do PCMark 2005) é o PCMark Vantage. Apesar de ser aceito no meio técnico, este programa é atualmente menos um benchmark sintético e mais um benchmark de sistema. Por exemplo, em um dos testes de CPU existe o “web page rendering”, no qual páginas de Internet são escritas na tela com máxima velocidade. O desempenho depende do processador, mas também da placa de vídeo. Diferenças relativamente grandes são observadas quando usamos placas de vídeo diferentes ou discos rígidos diferentes. Como resultado, cada processador recebe um índice “CPU Test” que não depende somente do processador, mas de outros módulos. Para comparar processadores diferentes seria preciso, em todos os testes, usar placas de vídeo idênticas e discos rígidos idênticos. Além disso, se a placa de vídeo e o disco rígido não tiverem altíssimo desempenho, penalizarão os resultados obtidos pelos processadores mais velozes.

Fizemos o teste do Phenom II X6 1090T e do Phenom II X4 965 no mesmo sistema, trocando apenas o processador. A configuração em ambos os testes foi:

Memória: 4 GB (2 x 2GB) DDR3/1600 em dual channel

HD de 1.5 TB Seagate ST31500541AS

Placa de vídeo HIS Radeon HD 5850 com 1 GB de memória

Windows 7 Ultimate

PCMark Vantage, 64 bits

PCMARK VANTAGE Phenom II X4 965 Phenom II X6 1090T Ganho
PCMark 6972 PCMarks 7429 PCMarks +6,5%
Memories 6189,00 6258,00 +1,1%
TV and Movies 4750,00 5272,00 +10,9%
Gaming 7405,00 7914,00 +6,9%
Music 6786,00 6690,00 -1,4%
Communications 7823,00 7414,00 -5,3%
Productivity 6938,00 7113,00 +2,5%
HDD 3932,00 3850,00 -2,1%

Tabela 8: Testes do X4 e do X6 com o PCMark Vantage

O PCMark Vantage realiza oito bateria de testes, com duração total de 1 hora e meia (no nosso caso, pois o tempo total depende da velocidade dos componentes testados). De todos os testes, aquele mais importante para comparação de processadores é o primeiro (índice PCMark). Nos nossos testes o índice obtido pelo Phenom II X6 foi 6,5% mais veloz. Note que esse é um benchmark de sistema, e não sintético. A maioria dos testes realizados pelo PCMark exige trabalho pesado de menos de quatro núcleos, quando o desempenho fica realmente cerca de 6% maior (3,6 GHz / 3,4 GHz). Nos testes que exigem o uso de todos os núcleos o Phenom II X6 leva vantagem maior, entretanto o índice apresentado é a média de todos os testes. Como este programa não é mais um benchmark sintético, não é dada prioridade aos testes individuais, e sim à média geral.

Nos demais conjuntos de testes, o ganho do Phenom II X6 foi também pequeno em comparação com o Phenom II X4, e em alguns casos o desempenho foi até um pouco menor. Note que todos esses testes são influenciados por outros fatores, como o desempenho do disco rígido e da placa de vídeo. As operações com arquivos no disco rígido sofrem variações de velocidade, dependendo da localização dos arquivos no disco (trilhas externas apresentam taxa de transferência mais alta).

A simples comparação numérica dos resultados que o Pcmark Vantage apresenta para os modelos X4 e X6 nos levaria à conclusão de que estaríamos comprando um processador quase duas vezes mais caro para ter um desempenho apenas 6,5% maior. É uma conclusão equivocada. O ganho máximo do modelo X6 em relação ao X4 ocorrerá apenas em duas situações:

a) Com programas pesados que aproveitem todos os núcleos ao mesmo tempo, e que sejam otimizados para usar ao máximo todos os núcleos, como é o caso do Handbrake

b) Quando forem usados vários programas pesados, os núcleos tendem a ficar todos com máxima utilização, então o modelo de 6 núcleos ganhará do modelo de 4 núcleos. Por exemplo, rodar um jogo 3D moderno ao mesmo tempo em que é feita a codificação de um lote de arquivos de vídeo.

Fora esses dois casos, o modelo de 6 núcleos (e o de 4 também) estará sub-aproveitado. É também verdade que:

a) Para um computador parado, um modelo avançado é 0% mais veloz que um modelo simples.

b) Para digitação de texto e tarefas simples, um modelo avançado é 0% mais veloz que um modelo simples.

De fato, ao realizar seus testes, o programa PCMark Vantage não utiliza todos os núcleos do processador. Muitas das suas tarefas dependem mais do desempenho do vídeo e do disco rígido, e em grande parte de tempo não mantém todos os núcleos do processador ocupados. Veja por exemplo o gráfico de uso da CPU durante a execução do PCMark Vantage, na figura 9.

hard-113

Figura 12 – PCMark Vantage, uso da CPU monitorado com o Gerenciador de Tarefas (CLIQUE PARA AUMENTAR)

No exato instante mostrado na figura 9, o uso total do processador está marcando 99%. Realmente os gráficos dos seis núcleos, na sua parte direita, estão próximos a 100%. Entretanto ao longo do tempo, considerando os gráficos por completo, vemos que quase sempre os núcleos estão apenas parcialmente ocupados. Sendo assim, o processador de 6 núcleos não mostra todo o seu potencial. O índice de desempenho é uma média obtida nos vários testes, e naqueles que usam menos núcleos, a pontuação será igual à dos processadores mais simples. Por um lado isso é correto, pois nem sempre um usuário utilizará tarefas pesadas que demandam trabalho de todos os núcleos. Por outro lado, é injusto usar este método para fazer a avaliação de um processador, já que o usuário pode estar interessado exatamente nas aplicações de atividade mais intensa, que aproveitam ao máximo todos os núcleos. Como vemos a coisa é complexa, e não devemos levar em conta somente o índice final obtido para comparar processadores.

PCMARK VANTAGE Phenom II X4 965 Phenom II X6 1090T Core i7 930 Ganho
PCMark 6972 PCMarks 7429 PCMarks 8263 PCMarks +11,2%
Memories 6189,00 6258,00 6921 +10,6%
TV and Movies 4750,00 5272,00 5287 +0,3%
Gaming 7405,00 7914,00 9169 +15,8%
Music 6786,00 6690,00 6846 +2,3%
Communications 7823,00 7414,00 6823 -8,0%
Productivity 6938,00 7113,00 7089 -0,3%
HDD 3932,00 3850,00 4089 +6,2%

Tabela 9: Testes do X4, X6 e i7 com o PCMark Vantage

O programa PCMark Vantage, infelizmente, não pode ser considerado um software totalmente preciso para avaliar a performance individual de um processador. Vamos justificar porque, aproveitando para comentar um concorrente Intel do Phenom II X6 1090T, o Core i7 930. Este processador ocupa a mesma faixa de preço que o Phenom II X6 1090T. Apesar dos clocks dos seus núcleos serem 2.8 GHZ, apresenta desempenho sensivelmente maior, de acordo com o PCMark Vantage. Nos testes realizados, usamos o mesmo disco rígido (Seagate 1,5 TB) e a mesma placa de vídeo (HIS 5850) dos testes do Phenom II. De acordo com o PCMark Vantage, o sistema da Intel apresentou ganho de desempenho na maioria dos testes. O índice geral PCMark apresentou ganho de 11,2%. O problema é que esses resultados variam de acordo com a configuração de hardware usada no teste. Veja por exemplo os resultados apresentados para esses três processadores nos nossos testes e em testes feitos pelo Tom’s Hardware Guide, que são considerados bastante precisos. Adicionamos na tabela os índices relativos ao processador Phenom II X4 965.

 

Nossos testes Tom’s Hardware
Phenom II X4 965 6972 (1.000) 7139 (1.000)
Phenom II X6 1090T 7429 (1.065) 7127 (0.998)
Core i7 930 8263 (1.185) 8046 (1.127)

Tabela 10: Testes do ForumPCs e do Tom’s Hardware Guide

Em veículos diferentes, com placas de vídeo e HDs diferentes, o Phenom II X6 1090T mostrou-se 6,5% mais rápido ou 0,2% mais lento que o X4. O Core i7 930 mostrou ser 18,5% ou 12,7% mais rápido. É correto afirmar que cada núcleo do Core i7 é mais veloz que cada núcleo do Phenom II com mesmo clock. A vantagem do Core i7 é mais acentuada quando lembramos que o clock do Phenom II X6 do nosso exemplo é 3,2 GHz (3,6 com Turbo Core) contra 2,8 GHz (3,06 com Turbo Boost) do Core i7.

Mas nosso objetivo aqui não é iniciar mais uma das discussões Intel x AMD, já bastante populares. Antes de festejar o ganho de performance do i7, é preciso também comparar o seu preço, o preço da placa mãe, levar em conta que estão sendo usados 3 módulos (triplo canal, com 6 GB que talvez raramente sejam necessários, quando 4 GB com duplo canal atenderia muito bem e apresentaria custo menor). O que queremos mostrar aqui é a dificuldade do PCMark Vantage em apresentar medidas realistas para a velocidade do processador. Veja por exemplo o que acontece nos testes do Core i7 quando trocamos a placa de vídeo. Fizemos os testes em condições semelhantes, mas usando placas com chips GeForce 7600 GTS e ATI 5850.

ATI 5850 Nvidia 7600
PCMark Suite 8263 PCMarks 7563 PCMarks
PCMark Memories 1 19,22 18,69
CPU image manipulation 8,617 MB/s 8,645 MB/s
HDD – importing pictures to Windows Photo Gallery 42,889 MB/s 40,417 MB/s
PCMark Memories 2 5,57 5,55
Video transcoding – VC-1 to WMV9 5,570 MB/s 5,548 MB/s
PCMark TV and Movies 1 6,55 6,52
Video transcoding – VC-1 to VC-1 1,437 MB/s 1,434 MB/s
Video playback – VC-1 HD DVD with SD commentary 29,846 FPS 29,678 FPS
PCMark TV and Movies 2 43,65 42,69
HDD – Windows Media Center 64,179 MB/s 61,431 MB/s
Video playback – VC-1 HD DVD with HD content 29,681 FPS 29,665 FPS
PCMark Gaming 1 304,49 106,82
Data decompression 1548,220 MB/s 1617,642 MB/s
GPU gaming 59,883 FPS 7,054 FPS
PCMark Gaming 2 664,74 663,36

Tabela 11: A placa de vídeo afeta os resultados dos testes do processador

O mesmo Core i7 930 recebeu do PCMark Vantage um índice de performance 9% maior quando executou os testes com uma placa de vídeo veloz. Observe na penúltima linha da tabela o motivo disso: o índice GPU Gaming com a ATI 5850 foi 58,883 FPS, enquanto com a placa GeForce 7600 apresentou apenas 7,054 FPS. Com a placa mais rápida, o índice PCMark Gaming foi quase 3 vezes maior (304,49 contra 106,82) e daí veio o ganho de 9,2% sobre o mesmo sistema com a placa de vídeo mais simples. De um modo geral, usar placas de vídeo e discos rígidos mais velozes tendem a acentuar as diferenças entre processadores diferentes, enquanto usar placas de vídeo e discos rígidos mais lentos tendem reduzir as diferenças. Por tudo isso é difícil avaliar com precisão, quanto um processador é mais veloz que outro, pelo menos com o PCMark Vantage.

Outro problema do PCMark Vantage na avaliação de processadores é que os resultados apresentam valores bem diferentes a cada vez que os testes são executados. É preciso executar a bateria completa de testes várias vezes para que o programa apresente os valores médios. O conjunto total de testes do PCMark Vantage dura cerca de uma hora e meia, seriam então quatro horas e meia para repetir os testes três vezes. Isso torna o trabalho de avaliação bastante demorado.

Por tudo isso, consideramos que o velho programa PCMark 2005, para Windows XP e limitado a testar quatro núcleos, apresenta resultados mais precisos na avaliação de processadores. É também um programa que apresenta resultados que não dependem da velocidade do disco rígido e da placa de vídeo, e sim, do processador e da memória. Apresentamos então as medidas feitas nos dois processadores Phenom II e no Core i7 930, todos com o HD Seagate de 1,5 TB e placa de vídeo HD 5850.

Phenom II X4 965(4x 3,4 GHz) Phenom II X6 3.2 GHz + Turbo Core Core i7 930+ Turbo Boost
1 Compactação de arquivos 15,945 MB/s 16,712 MB/s 13,319 MB/s
2 Descompactação de arquivos 207,263 MB/s 216,914 MB/s 190,395 MB/s
3 Encriptação de arquivos 92,456 MB/s 97,416 MB/s 82,170 MB/s
4 Decriptação de arquivos 83,497 MB/s 87,866 MB/s 81,652 MB/s
5 Descompressão de imagem 43,964 MP/s 46,550 MP/s 41,043 MP/s
6 Compressão de áudio 3947 kB/s 4166 kB/s 4306 kB/s
7A Compactação de arquivos 15,900 MB/s 16,700 MB/s 13,317 MB/s
7B Encriptação de arquivos 92,624 MB/s 97,414 MB/s 82,255 MB/s
8A Descompactação de arquivos 206,720 MB/s 196,438 MB/s 190,354 MB/s
8B Decriptação de arquivos 83,351 MB/s 78,436 MB/s 81,666 MB/s
8C Descompressão de áudio 3282 kB/s 3109 MB/s 3542 MB/s
8D Descompressão de imagem 43,764 Mpixels/s 41,435 Mpixels/s 40,867 Mpixels/s

Tabela 12: Comparação com o i7, feita com o PCMark 2005

O resultado obtido com este velho programa mostra uma vantagem dos processadores Phenom II X4 e X6 na maioria das aplicações que usam um ou dois núcleos. Já nas aplicações que usam quatro núcleos, existe alguma vantagem no Core i7.

Os resultados acima são bem interessantes. É bem sabido no meio técnico que o Core i7 leva vantagem sobre o Phenom II X4 e o Phenom II X6 em uma comparação clock por clock. As medidas realizadas entretanto mostram que nem sempre isso é assim. Com o Turbo Core, o Phenom II X6 1090T tem seu clock elevado para 3,6 GHz nas aplicações que demandam esforço de até 3 núcleos, enquanto o Core i7 930 vai para 3,06 GHz com o Turbo Boost. Uma vantagem de quase 20% no clock faz os núcleos do Phenom II levarem vantagem sobre o Core i7.

Essa discussão deve levar os leitores a refletirem sobre a questão de desempenho. Cada usuário individualmente nem sempre tem dois processadores rivais para comparar, em sistemas semelhantes. Nós que temos os processadores em mãos, nem sempre temos os programas que interessam ao usuário. Um meio termo interessante é o realizado no Tom’s Hardware Guide, que faz testes exaustivos em praticamente todos os modelos de processadores (já que os recebe para avaliação com mais facilidade). Replicamos aqui os resultados de alguns testes de benchmark feitos com alguns processadores Intel e AMD. Todos os da tabela são de 4 núcleos, exceto o Phenom II X6, de 6 núcleos. Não foram feitos testes com o i7-930, mas replicamos os resultados do i7-920 e do i7-940, que são modelos próximos. Mostramos também os resultados do i5-750, que tem se mostrado uma excelente opção de 4 núcleos. As tabelas mostram que em alguns casos o Phenom II X6 leva vantagem, em outros tem dificuldades para competir com o i7, e algumas vezes até com o i5 de 4 núcleos (lembre-se que existem vários modelos de i5 com 2 núcleos).

Core i7-940
Core i7-920 Core i5-750 Phenom II X4 965 Phenom II X6 1090T
Adobe Photoshop CS 4 Image Processing (Applying 6 filters to a 69 MB TIF image) Score in Time [seconds] 110.00 120.00 126.00 166.00 122.00
Left 4 Dead 1.0.0.5 1280×800 (Medium settings)
Score in FPSGo
162.60 145.90 157.80 156.00 142.90
3DS Max 2009 Image Rendering (1920×1280)
Score in Time [seconds]Go
155.00 166.00 188.00 179.00 175.00
3DMark Vantage 1.0.2 Overall Score
Score in Score Go
11580.00 11498.00 11273.00 11414.00 11416.00
SiSoftware Sandra 2009 SP3 Processor Arithmetic MFLOPS Score in ScoreGo 64.43 58.26 32.36 39.76 56.17
iTunes 8.1.0.52 Audio Transcoding
(wav to aac) Score in Time [seconds]Go
95.00 105.00 98.00 133.00 137.00
DivX 6.8.3 Video Transcoding: MPEG-2 to AVI
(Insane Quality) Score in Time [seconds]Go
87.00 95.00 92.00 110.00 111.00
3DMark Vantage 1.0.2 CPU
CPU Score Score in Score Go
43063.00 39900.00 37650.00 36741.00 41025.00
Performance Index 50% Time Based Scores, 25% Games (12.5 % Pcmark Suite, 12.5 3DMark CPU ) 1227.83 1151.60 1087.27 1081.40 1091.37
SiSoftware Sandra 2009 SP3 Cryptography
AES256 Encryption Score in MB/secGo
553.00 505.00 458.00 505.00 736.00
Lame 3.98 Audio Encoding: wav to mp3
(160 Kbit/s) Score in Time [seconds]Go
146.00 160.00 142.00 181.00 173.00
WinZIP 12 (8252) File Compression (4096 KB dictionary) (maximum compression) Score in Time [seconds]Go 273.00 296.00 301.00 309.00 294.00
SiSoftware Sandra 2009 SP3 Memory Bandwidth Score in GB/secGo 20.12 20.00 16.63 13.13 13.74
Adobe Acrobat 9 Professional PDF Document Creation Score in Time [seconds]Go 89.00 97.00 97.00 112.00 109.00

Tabela 13: Comparação de processadores

Fonte: Tom’s Hardware Guide, www.tomshardware.com

Core i7-940 Core i7-920 Core i5-750 Phenom II X4 965 Phenom II X6 1090T
GTA IV 1.0.3 1280×1024 (Medium settings, Vsync off) Score in FPSGo 60.90 60.50 60.80 62.10 61.10
PCMark Vantage RAM Memories Suite
Score in ScoreGo
6736.00 6498.00 6022.00 5665.00 5628.00
SiSoftware Sandra 2009 SP3 Processor Arithmetic ALU Performance (Dhrystone) Score in ScoreGo 74.80 68.37 69.00 50.82 75.49
Adobe Premiere Pro CS4 1440×1080 Video Editing Score in Time [seconds]Go 75.00 70.00 134.00 136.00 79.00
AVG Anti-Virus 8.5.287 Scanning ZIP and RAR archives for viruses Score in Time [seconds]Go 176.00 178.00 235.00 234.00 181.00
3DMark Vantage 1.0.2 GPU
GPU Score Score in Score Go
9311.00 9293.00 9139.00 9281.00 9202.00
SiSoftware Sandra 2009 SP3 Cryptography
Encryption Score Score in MB/secGo
533.00 487.00 490.00 566.00 811.00
Fritz 11 Chess game (multi-threaded)
Score in ScoreGo
11345.00 10383.00 8241.00 8266.00 11211.00
XviD 1.2.1 Video Transcoding: MPEG-2 to AVI
Score in Time [seconds]Go
131.00 142.00 135.00 156.00 164.00
WinRAR 3.9 x64 Beta1 File Compression (multi-threaded) (maximum compression) Score in Time [seconds]Go 45.00 47.00 62.00 88.00 79.00
SiSoftware Sandra 2009 SP3 Cryptography
SHA256 Encryption Score in MB/secGo
514.00 469.00 523.00 628.00 886.00
Mainconcept Reference 1.6.1 Video Transcoding: MPEG-2 to H.264/AVC (FullHD Video) Score in Time (s) Go 90.00 98.00 123.00 118.00 89.00
Far Cry 2 1.0.1 1280×800 (Medium settings, HDR off) Score in FPSGo 109.50 108.40 103.10 90.90 87.00
PCMark Vantage PCMark Suite
Score in ScoreGo
8257.00 7835.00 7769.00 7139.00 7127.00

Tabela 14: Comparação de processadores

Fonte: Tom’s Hardware Guide, www.tomshardware.com

Temperatura

Assim como ocorre com o Phenom II X4, o Phenom II X6 1090T é um processador bem quente. Dissipa 125 watts e suporta uma temperatura máxima de 62°C. Em caso de uso extremo, esta temperatura máxima é facilmente atingida. Devemos tomar os cuidados usuais com a refrigeração do processador e do gabinete.

Fizemos um teste visando a levar o Phenom II X6 à sua temperatura limite. Ao invés de instalar o cooler que o acompanha na versão BOX, usamos inicialmente um cooler simples, típico de processadores AMD que dissipam 65 watts ou menos.

Figura 13 – Cooler inadequado para o Phenom II X6

Usamos no gabinete um cooler traseiro de 12 cm expulsando o ar quente para fora, uma fonte de alimentação com ventilador interno e duto lateral de ventilação no gabinete, apesar do cooler ser inadequado. O ambiente estava à temperatura de 27°C. Depois de alguns minutos com o computador inativo, o interior do gabinete estabilizou sua temperatura em 42°C, com processador estabilizado a 44°C. Colocamos em execução o programa Handbrake para fazer uma codificação de vídeo, mantendo os seis núcleos com taxa de utilização acima de 95%. O gabinete permaneceu a 42°C ao longo do teste, mas o processador esquentou bastante em poucos minutos:

Temperatura inicial 44°C
0:30 48°C
1:00 52°C
1:30 55°C
2:00 57°C
2:30 59°C
3:00 60°C
4:00 62°C

Tabela 15: Temperatura do processador com cooler inadequado

Em apenas quatro minutos o processador atingiu sua temperatura máxima permitida. Interrompemos o teste para evitar danos. Na verdade o processador tem uma proteção interna, reduzindo o seu clock quando a temperatura máxima é atingida. Ainda assim, como o processador foi emprestado pela AMD para o teste, resolvemos exagerar no cuidado.

Fizemos a seguir a instalação do cooler correto para este processador, mostrado na figura abaixo. Na verdade a AMD enviou o processador sem cooler, usamos então o cooler de um outro Phenom II X6 disponível em nosso laboratório.

hard-114

Figura 14 – Cooler correto do Phenom II X6 1090T

Repetimos os testes nas mesmas condições, e dessa vez a temperatura ficou estabilizada em 51°C. As condições de temperatura desse segundo teste foram:

Temperatura ambiente: 27°C.

Temperatura interna do gabinete: 36°C

Temperatura do processador em repouso: 35°C

A tabela abaixo mostra a evolução da temperatura do processador ao longo do teste.

Gabinete Processador
Temperatura inicial 36°C 35°C
0:30 36°C 40°C
1:00 36°C 44°C
1:30 36°C 46°C
2:00 36°C 47°C
2:30 36°C 48°C
3:00 36°C 48°C
3:30 37°C 49°C
4:00 37°C 49°C
5:00 37°C 50°C
6:00 37°C 50°C
7:00 38°C 51°C
8:00 38°C 51°C
9:00 39°C 51°C
10:00 39°C 51°C

Tabela 16: Temperatura do processador com cooler adequado

Apesar da sua elevada dissipação de 125 watts, o processador teve sua temperatura estabilizada em 51°C, ficando apenas 12°C acima da temperatura interna do gabinete. Ainda temos uma margem de 11°C até chegar à temperatura máxima suportada pelo processador, mesmo com quase 100% de ocupação nos 6 núcleos. Isso tudo só pode ser conseguido com o uso do cooler correto e com os cuidados usuais com a ventilação do gabinete.

Conclusão

É fato que um núcleo de processador moderno Intel é mais veloz que um núcleo de processador moderno da AMD de mesmo clock. A AMD compensa essa diferença oferecendo processadores com custo menor. Há poucos anos atrás, os processadores mais novos recém lançados, tanto da AMD quanto da Intel, custavam cerca 1000 dólares em lotes de 1000 peças (E.U.A). O Phenom II X6 1090T custa menos que 300 dólares, também em lotes de 1000 peças. Apesar de não competirem diretamente com os modelos mais velozes da Intel, que são bem mais caros, os novos processadores de 6 núcleos da AMD não fazem feio quando comparados a processadores Intel de custo semelhante. Como podem ter desempenho similar com clocks menores, os processadores Intel que rivalizam com o Phenom II X6 em preço e desempenho apresentam outro ponto favorável: a baixa dissipação de calor. Isso é em parte conseqüência do uso do processo de fabricação Intel com transistores de 32 nm, enquanto a AMD ainda está usando o processo de 45 nm. Com a adoção do processo de 32 nm, a AMD poderá oferecer outras vantagens, como redução de dissipação de calor e redução de custo.