AC 04 Memoria 2013

Arquitetura de Computadores
A Hierarquia de Memórias
Prof. Denis Franco
denisfranco@furg.br
Maio 2013
Universidade Federal do Rio Grande

Centro de Ciências Computacionais
Programa de Pós-Graduação em Computação
Mestrado em Engenharia de Computação
Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 1 / 47

Outline
1 A Hierarquia de memórias
Introdução
Princı́pio de funcionamento
2 Memórias cache
O desempenho da cache
3 Memória virtual
4 Arquiteturas recentes

A Hierarquia de memórias
Outline
Introdução
2 Memórias cache
3 Memória virtual

A Hierarquia de memórias Introdução
Por que uma hierarquia de memórias?

Algum problema com a estrutura clássica acima?


Tecnologias de memória não ideais


SRAM
Alta velocidade
Baixa densidade (6T)
Alto custo
Volátil


SRAM
Alta velocidade
Baixa densidade (6T)
Alto custo
Volátil
DRAM
Média velocidade
Densidade maior que SRAM (1T)
Médio custo
Volátil




Magnéticas (HD)
Baixa velocidade
Alta densidade
Baixo custo
Não volátil


Magnéticas (HD)
Baixa velocidade
Alta densidade
Baixo custo
Não volátil
Flash
Média velocidade de leitura
Média densidade
Médio/baixo custo (1/10 DRAM)
Não volátil


Magnéticas (HD)
Baixa velocidade
Alta densidade
Baixo custo
Não volátil
Flash
Média densidade
Não volátil
Escrita em blocos...


Magnéticas (HD)
Baixa velocidade
Alta densidade
Baixo custo
Não volátil
Flash
Média densidade
Não volátil
Escrita em blocos...
Ciclo de vida de ≈ 100.000 escritas


Tecnologias de memória ideais?


Magnetic RAM


Magnetic RAM
3D Resistive RAM


Magnetic RAM
3D Resistive RAM
Phase change RAM


Magnetic RAM
3D Resistive RAM
Phase change RAM
Spin-transfer torque RAM


Magnetic RAM
3D Resistive RAM
Phase change RAM
Spin-transfer torque RAM
Para quando?


O gap de memória


Atualmente
Memory technology Typical access time $ per GB in 2008

SRAM 0.5-2.5 ns 2,000-5,000
DRAM 50-70 ns 20-75
Magnetic disk 5,000,000-20,000,000 ns 0.20-2

O que é uma hierarquia de memórias?
Hierarquia de memória
É a organização da memória em múltiplos nı́veis, com desempenhos,
custos e capacidades (tecnologias) diferentes, de forma a criar a ilusão de
uma memória de grande capacidade e alta velocidade, com um custo
próximo ao da memória mais acessı́vel.




Organização em sistemas recentes

A Hierarquia de memórias Princı́pio de funcionamento
Localidade de referências
Princı́pio da localidade de referências

Estabelece que, em um determinado perı́odo de tempo, um programa
acessa apenas uma pequena parte do seu espaço de endereços.


Localidade espacial
Localidade temporal


Localidade espacial
Refere-se à grande probabilidade de acesso sequencial a posições
contı́guas do espaço de endereços do programa
Localidade temporal


Localidade espacial
Refere-se à grande probabilidade de acesso sequencial a posições
contı́guas do espaço de endereços do programa
Localidade temporal
Refere-se à grande probabilidade de acessos subsequentes às mesmas
posições no espaço de endereços do programa

Concentração/localidade de referências
CPU
Espaço de endereços
da memória principal

Trechos com
localidade de
CPU referências

Trechos com
localidade de
CPU referências
Nível de memória rápida

Transferência de blocos
CPU Blocos

CPU

CPU

CPU

CPU

Questões básicas:

1 Onde colocar um novo bloco na memória mais rápida?

2 Como encontrar um bloco na memória mais rápida?

3 Qual bloco substituir em caso de necessidade?

3 Qual bloco substituir em caso de necessidade?
4 Qual a estratégia de escrita?

Memórias cache
Outline
Introdução
2 Memórias cache
3 Memória virtual

Memórias cache
Endereço original 6= endereço na cache...
wn 1000
wn+1 1004
bloco b
00 wn+2 1008
04 wn+3 100C
bloco b+1
08 wn+4 1010
0C wn+5 1014
bloco b+1
10 wn+6 1018
14 Endereços na wn+7 101C
18 wn+8 1020 Endereços
memória
1C rápida bloco b+2 1024 originais
20 1028
24 wn+11 102C
28 wn+12 1030
2C bloco b+3 1034
30 1038
34 wn+15 103C
38 wn+16 1040
3C bloco b+4 1044
1048

Memórias cache
Mapeamento de blocos na memória cache

Blocos x linhas
Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
endereço da linha
011111
Cache 100000
100001
linha 0 00
100010
linha 1 01
100011
linha 2 10
100100
linha 3 11
100101
100110
100111
101000
101001
bloco b+18 101010
endereço do bloco

Memórias cache

Blocos x linhas
palavra do bloco
Principal
bloco b 011000XX
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
endereço da linha
011111
Cache 100000
100001
00
100010
01
100011
10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010
endereço do bloco

Memórias cache

Mapeamento associativo

Memórias cache

Onde colocar um novo bloco na memória cache?
Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
011111
Cache 100000
100001
00
bloco b+10 100010
01
100011
10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
011111
Cache 100000
100001
bloco b+10 00
bloco b+10 100010
01
100011
10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
011111
Cache 100000
100001
00
bloco b+10 100010
01
100011
10
100100
bloco b+10 11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
011111
Cache 100000
100001
00
bloco b+10 100010
bloco b+10 01
100011
10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

Como encontrar um bloco na memória cache?
Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
bloco do endereço 100010? 011100
011101
011110
011111
Cache 100000
100001
00
bloco b+10 100010
bloco b+10 01
100011
10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
011111
TAG Cache 100000
100001
00
bloco b+10 100010
bloco b+10 01
100011
10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
011111
TAG Cache 100000
100001
00
bloco b+10 100010
100010 bloco b+10 01
100011
10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache


Memória associativa de n vias para armazenamento dos TAGs
Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
011111
TAG Cache 100000
100001
00
bloco b+10 100010
100010 bloco b+10 01
100011
10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

Mapeamento direto

Memórias cache

Mapeamento direto
Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
011111
Cache 100000
100001
00
bloco b+10 100010
01
100011
10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

Mapeamento direto
Linha na cache
Principal
bloco b −−−−00
bloco b+1 −−−−01
bloco b+2 −−−−10
−−−−11
−−−−00
−−−−01
−−−−10
−−−−11
Cache −−−−00
−−−−01
00
bloco b+10 −−−−10
01
−−−−11
10
−−−−00
11
−−−−01
−−−−10
−−−−11
−−−−00
−−−−01
bloco b+18 −−−−10

Memórias cache

Mapeamento direto
Linha na cache
Principal
bloco b −−−−00
bloco b+1 −−−−01
bloco b+2 −−−−10
−−−−11
−−−−00
−−−−01
−−−−10
−−−−11
Cache −−−−00
−−−−01
00
bloco b+10 −−−−10
01
−−−−11
bloco b+10 10
−−−−00
11
−−−−01
−−−−10
−−−−11
−−−−00
−−−−01
bloco b+18 −−−−10

Memórias cache

Mapeamento direto
Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011101
011110
011111
Cache 100000
100001
00
bloco b+10 100010
01
100011
bloco b+10 10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

Mapeamento direto
Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
ou 000010? 011101
ou 111110? 011110
ou 101010? 011111
Cache 100000
100001
00
bloco b+10 100010
01
100011
bloco b+10 10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

Mapeamento direto
Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
011111
TAG Cache 100000
100001
00
bloco b+10 100010
01
100011
bloco b+10 10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

Mapeamento direto
Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
011111
TAG Cache 100000
100001
00
bloco b+10 100010
01
100011
1000 bloco b+10 10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

Mapeamento direto

Comparação direta do endereço do bloco com o campo TAG
especı́fico
Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
011111
TAG Cache 100000
100001
00
bloco b+10 100010
01
100011
1000 bloco b+10 10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

Mapeamento grupo-associativo

Memórias cache

Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
011111
Cache 100000
100001
00
bloco b+10 100010
01
100011
10
100100
11
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011101
011110
011111
Cache 100000
100001
grupo 0 bloco b+10 100010
100011
grupo 1 100100
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache

grupo na cache
Principal
bloco b −−−−−0
bloco b+1 −−−−−1
bloco b+2 −−−−−0
−−−−−1
−−−−−0
−−−−−1
−−−−−0
−−−−−1
Cache −−−−−0
−−−−−1
grupo 0 bloco b+10 −−−−−0
−−−−−1
grupo 1 −−−−−0
−−−−−1
−−−−−0
−−−−−1
−−−−−0
−−−−−1
bloco b+18 −−−−−0

Memórias cache

grupo na cache
Principal
bloco b+1 −−−−−1
bloco b+2 −−−−−0
−−−−−1
−−−−−0
−−−−−1
−−−−−0
−−−−−1
−−−−−1
bloco b+10
−−−−−1
grupo 1 −−−−−0
−−−−−1
−−−−−0
−−−−−1
−−−−−0
−−−−−1
bloco b+18 −−−−−0

Memórias cache

grupo na cache
Principal
bloco b+1 −−−−−1
bloco b+2 −−−−−0
−−−−−1
−−−−−0
−−−−−1
−−−−−0
−−−−−1
−−−−−1
bloco b+10
−−−−−1
grupo 1 −−−−−0
−−−−−1
−−−−−0
−−−−−1
−−−−−0
−−−−−1
bloco b+18 −−−−−0

Memórias cache

Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011110
011111
TAG Cache 100000
100001
bloco b+10 100010
10001 bloco b+10
100011
100100
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache


Busca direta do grupo e associativa nos TAGs do grupo
Principal
bloco b 011000
bloco b+1 011001
bloco b+2 011010
011011
011100
011110
011111
TAG Cache 100000
100001
bloco b+10 100010
10001 bloco b+10
100011
100100
100101
100110
100111
101000
101001
bloco b+18 101010

Memórias cache
Associativo
Melhor aproveitamento da cache
Muito complexo para associatividade maior que 16
Direto
Pior aproveitamento da cache
Implementação simples
Grupo-associativo
Aproveitamento da cache próximo ao do associativo
Complexidade de implementação intermediária

Memórias cache
Gerência de blocos na cache

Memórias cache
Qual bloco substituir em caso de necessidade?

Referente apenas ao mapeamento grupo-associativo

Memórias cache

Algoritmos de substituição

Memórias cache

Least recently used (LRU)
First in, first out (FIFO)
Random

Memórias cache

First in, first out (FIFO)
Random
Pseudo-LRU

Memórias cache
Atualização de blocos na memória

Memórias cache
Qual a estratégia de escrita?

Memórias cache

Bloco presente na cache
Bloco ausente na cache

Memórias cache

Write-through
Write-back

Memórias cache

Write-through
Write buffer
Write-back

Memórias cache

Write-through
Write buffer
Write-back
Dirty bit

Memórias cache

Write-through
Write buffer
Write-back
Dirty bit
Write allocate
No-write allocate

Memórias cache O desempenho da cache
Hit & miss

Hit & miss
Tempo de acesso à memória:

Hit & miss
Average memory access time(AMAT ) = Hit time + Miss rate · Miss penalty

Hit & miss
Hit time: tempo para acesso à cache

Hit & miss

Miss rate: taxa dos acessos à memória não satisfeitos pela cache

Hit & miss

Miss rate: taxa dos acessos à memória não satisfeitos pela cache
Miss penalty : tempo de acesso à memória principal

Otimização da cache
AMAT = Hit time + Miss rate · Miss penalty

Estratégias para melhorar o desempenho da cache:


Redução do hit time
Redução da miss rate
Redução da miss penalty


Menor capacidade da cache
Melhor tecnologia de fabricação


Maior capacidade da cache
Blocos maiores
Maior associatividade


Maior capacidade da cache
Blocos maiores
Blocos menores
Caches multinı́vel

Blocos maiores

Blocos maiores
SPEC92, DECstation 5000.


Tempo médio de acesso (ns).

hit time x associatividade

hit time x associatividade
Tempo de acesso (ps).

Consumo x associatividade

Consumo x associatividade

Split caches
Arquitetura Harvard de memória
Taxa de miss para 1000 acessos, Alpha, SPEC2000, 2 vias, blocos de 64

bytes.

Desempenho x algoritmos de substituição

Desempenho x algoritmos de substituição
Taxa de miss para 1000 acessos, Alpha, SPEC2000.



AMAT = Hit timeL1 + Miss rateL1 · (Hit timeL2 + Miss rateL2 · Miss penaltyL2 )

AMAT = Hit timeL1 + Miss rateL1 · (Hit timeL2 + Miss rateL2 · Miss penaltyL2 )
Miss local x miss global

Sumário das técnicas

Sumário das técnicas

Memória virtual
Outline
Introdução
2 Memórias cache
3 Memória virtual

Memória virtual
Por que memória virtual?

Memória virtual

Evolução do conceito de overlays
Gerencia a relação entre a memória principal e a secundária
Gerencia a relocação de código
Implementa esquemas de proteção do espaço de endereços dos
aplicativos

Memória virtual

Evolução do conceito de overlays
Gerencia a relação entre a memória principal e a secundária
Gerencia a relocação de código
Implementa esquemas de proteção do espaço de endereços dos
aplicativos

Memória virtual
Princı́pios de funcionamento
Memória virtual x memória cache

Memória virtual
Gerência por SW(OS) x gerência por HW(MMU)

Transferência de blocos entre os nı́veis

Memória virtual

Páginas e segmentos x blocos/linhas

Memória virtual

Onde colocar um novo bloco na memória mais rápida?

Memória virtual


Memória virtual

Como encontrar um bloco na memória mais rápida?

Memória virtual

Mapa da memória
Page fault

Memória virtual

Mapa da memória
Page fault

Memória virtual

Mapa da memória
Page fault

Memória virtual

Mapa da memória
Page fault

Memória virtual

Mapa da memória
Page fault
Write-back

Memória virtual
Parâmetros nos diferentes nı́veis:

Memória virtual
Páginas x segmentos
Caracterı́sticas:
Divisão de um programa:

Memória virtual
Mapa da memória
Tabela de páginas:

Memória virtual
Mapa da memória
Tamanho dependente do número de páginas no espaço de endereços

virtual

Memória virtual
Mapa da memória

virtual
Tabela de páginas invertida: função Hash para endereçamento

Memória virtual
Mapa da memória

virtual
Tabela de páginas invertida: função Hash para endereçamento
Tamanho dependente do número de páginas fı́sicas
Memória virtual
Endereços virtuais → endereços fı́sicos

Memória virtual
Tradução de endereços = acesso à tab. páginas na memória

Memória virtual

Translation lookaside buffer (TLB)

Memória virtual

Translation lookaside buffer (TLB)
TLB do processador Opteron.

Arquiteturas recentes
Outline
Introdução
2 Memórias cache
3 Memória virtual

ARM Cortex-A8
Split cache

ARM Cortex-A8
Split cache
L1 cache
32 KB, blocos de 64 bytes
Grupo-associativa com 4 vias
L2 cache
1 MB, blocos de 64 bytes
TLB
32 entradas
Associativa

ARM Cortex-A8

ARM Cortex-A8
Minniespec benchmark.

ARM Cortex-A8
Minniespec benchmark.

Intel Core-i7
Por núcleo:

Intel Core-i7
Por núcleo:
L1 cache
32 KB + 32 KB, blocos de 64 bytes
Grupo-associativa com 4(I)/8(D) vias
Latência: 4 ciclos
L2 cache
256 KB, blocos de 64 bytes
Compartilhada:
L3 cache
8 MB, blocos de 64 bytes
TLB
128(I)/64(D)/512(L2) entradas

AC 04 Memoria 2013

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

AC 04 Memoria 2013

Diunggah oleh

Hak Cipta:

Format Tersedia

Arquitetura de Computadores

Prof. Denis Franco

Universidade Federal do Rio Grande

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 1 / 47

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 2 / 47

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 3 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 4 / 47

Por que uma hierarquia de memórias?

Algum problema com a estrutura clássica acima?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 4 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 5 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 5 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 5 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 6 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 6 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 6 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 6 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 6 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 7 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 7 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 7 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 7 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 7 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 7 / 47

Por que uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 8 / 47

Por que uma hierarquia de memórias?

Memory technology Typical access time $ per GB in 2008

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 9 / 47

O que é uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 10 / 47

O que é uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 10 / 47

O que é uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 10 / 47

O que é uma hierarquia de memórias?

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 11 / 47

Princı́pio da localidade de referências

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 12 / 47

Princı́pio da localidade de referências

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 12 / 47

Princı́pio da localidade de referências

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 12 / 47

Princı́pio da localidade de referências

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 12 / 47

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 13 / 47

Prof. Denis Franco (denisfranco@furg.br) Arquitetura de Computadores Maio 2013 13 / 47

Nível de memória rápida