Virtual vs Physical memory 프로그래머는 virtual memory만을 보고 있어서 메모리 공간이 거의 무한하다고 느끼지만 실제 사용할 수 있는 physical memory 공간은 프로그래머가 추정하는 것보다 훨씬 작다. 시스템(system softeware + hardware)은 virtual memory와 physical memory를 서로 mapping 해준다. 이때 시스템이 physical memory를 잘 관리해준다면 프로그래머 입장에서는 메모리 공간이 엄청 거대하다고 느끼는 것이다. Memory Hierarchy 이상적인 메모리라 함은 공간이 넓고 빠르며 값싼 메모리일 것이다. 하지만 현실적으로 불가능한 일이다. 공간이 넓으면 데이터의 위치를 특정하는데 오래 걸리기 때문에 ..
Thread란?Thread는 메모리와 레지스터 상태에 대한 명령어 흐름을 나타내며, CPU가 실행하는 기본 단위이다. Thread가 실행 중일 때, 그 상태는 register states로 표현되며 이를 Thread Context라고 부른다. Thread는 프로그램의 병렬 실행을 가능하게 하며, 현대 프로세서 설계에서 중요한 요소이다. Multithreading이란?Multithreading은 하나의 프로세서가 여러 Thread Context를 가지는 구조를 말한다. 이를 통해 하나의 프로세서가 여러 작업을 병렬적으로 처리할 수 있다. 이러한 방식은 CPU의 유휴 시간을 줄이고 자원의 활용도를 극대화하여 성능을 향상시킬 수 있다. Multithreading의 장점Multithreading은 다양한..
오늘은 '이진 탐색 트리'에 대해서 공부해보았다. 우선 이진 탐색 트리에 대해 알기 전에 '트리'라는 개념을 먼저 살펴보자. 이진 트리(Binary Tree) 트리란 그래프의 일종으로, 노드들이 나뭇가지처럼 연결된 형태를 띄는 비선형 자료구조이다. 비선형 자료구조라는 것은 스택, 큐와 같이 하나의 자료 뒤에 하나의 자료가 연결되어 있는 선형 자료구조와 달리 하나의 자료 뒤에 여러 개의 자료가 연결될 수 있는 구조를 뜻한다. 위 그림은 트리의 일종인 이진 트리의 예시 중 하나이다. 이진 트리는 자식 노드를 최대 두 개 가지는 트리를 뜻한다. 여기서 노드(node)란 위 그림에서 사각형 박스를 의미하며 일반적으로 데이터가 그 안에 담긴다. 그리고 이 노드들을 이어주는 선을 엣지(edge)라고 부른다. 어떤 ..
Memory Protection메모리에서 각 각의 프로세스가 서로 간섭해서는 안되기 때문에 memory protection이 필요함process가 시작하는 메모리 주소를 base, 끝나는 주소를 base+limit로 정하고 이 정보는 각각 레지스터에 담겨있다. Address BindingCPU는 프로세스를 실행시킬 때 프로세스의 논리적 주소(logical address)를 참고한다. 이때 logical address만으로는 실제 메모리의 주소를 없으므로 logical memory와 실제 메모리의 주소인 physical memory를 연결시키는 작업이 필요하고 이를 address binding이라 한다. source program을 컴파일하면 machine instruction을 가지고 있는 objec..
컴파일 과정에서부터 data dependeces을 감지하고 nop을 넣어 depenceces를 제거하는 것 data를 write하기 이전에 미리 그 값을 다음 명령어로 전달해주는 방식 다음 명령어로 data를 전달해줄 수 있는 line 만들어 data dependences를 줄인다. 하지만 모든 경우에 적용될 수 있는 것은 아니고 어쩔 수 없이 stall 해줘야 하는 상황이 있을 수 있다. ex) lw 다음에 and 명령어가 올 때 등 그 이전에 하드웨어를 추가로 둬서 branch가 taken인지 not taken인지, taken이라면 어디로 가야하는지를 ALU 이전에 계산하는 방식 장점 - branch를 잘못 예측했을 때의 패널티를 줄일 수 있다 -> CPI가 줄어듬 단점 - clock cycle ti..
파이프 라인으로 인해 줄일 수 있는 시간은 가장 긴 pipeline state의 영향을 받는다. Pipeline state의 개수가 많아질수록 속도가 빨라질 수 있다. Pipeline state의 시간의 언벨런스 하면 속도가 느려진다. 1. Instruction fetch(IF) - 메모리에서 instruction을 불러와서 instruction register에 저장, pc+4 - IR을 다음 state 전까지 가지고 있음(한 싸이클마다 state가 바뀜) 2. Instruction Decode/Register Fetch Cycle(ID) - Instruction을 디코딩하고 register value를 읽어옴 - 16비트를 확장 - 다음 state 전까지 가지고 기다림 3. ALU Execution(..
메모리에 instruction data가 올라오고 cpu는 매 클럭마다 instruction을 수행 컴파일러: high lever language를 다른 언어로 변환(컴파일)하고 그 결과를 목적 파일에 써 놓는 프로그램 인터프리터: 기계어로의 컴파일 과정을 거치지 않고 소스코드를 바로 실행하는 일종의 가상머신 어셈블러: 어셈블리 언어 프로그램을 기계어 프로그램으로 변환함 레지스터 - 레지스터는 메모리에서 가져온 데이터를 저장하는 CPU 내부 스토리지이다. - 한 사이클에 읽거나 쓸 수 있다. - 산술논리 연산자가 동작한다 - MIPS ISA에는 32개의 32bit 레지스터가 존재한다. 각 레지스터는 32개의 플립플롭을 가지고 있다. - 레지스터가 32개인 이유는 레지스터 수가 매우 많으면 단순히 더 멀리..
컴퓨터의 세가지 중요 요소 - computation, communication, storage/memory 성능이 높아질수록 필요한 파워가 늘어나 효율이 좋지 않음 -> 하나의 코어의 성능을 높이기보다는 여러 개의 코어를 사용하는 것으로 바뀜 Performance = 1/execution time Cpu execution time = Cpu clock cycles(required for executing a program) X Clock cycle time Clock cycle time = 1/clock speed Execution time = clock cycle time X instructions X avg CPI(avg clock cycle per instruction) SPEC: System Pe..
Cash coherence캐시는 현대 컴퓨터 아키텍처, 특히 성능에서 중요한 구성 요소입니다. 캐시는 메모리에 데이터 복사본을 유지 관리하므로 프로세서 코어의 데이터에 더 빨리 액세스할 수 있습니다. 일반적으로 프로세서는 여러 레벨의 캐시를 포함하며, 이는 그림 1과 같이 속도와 크기 면에서 다릅니다. 이 경우 캐시와 메인 메모리에 여러 개의 데이터 복사본이 존재할 수 있습니다. 한 코어가 로컬 캐시의 데이터를 수정하는 경우 다른 코어가 로컬 캐시의 오래된 데이터를 사용하지 않기 때문에 프로세서는 캐시 간의 데이터 일관성을 보장해야 합니다. 캐시 쓰기를 처리하는 데는 두 가지 일반적인 접근 방식이 있습니다:Write through: 캐시와 메모리를 즉시 write (시간이 오래 걸림)Write back:..
Deadlock프로세스가 자원을 얻지 못해 다음 처리를 하지 못하는 상태로 ‘교착 상태’라고도 한다. System model- CPU, files, I/O device 등의 리소스들은 R로 표현- 각 리소스 R은 인스턴스 W를 가짐(R이 CPU라면 W는 CPU 코어들)- Request , use, release Deadlock 발생조건1. Mutual exclusion – 하나의 리소스는 하나의 스레드만 사용할 수 있다.2. Hold and wait – 이미 하나의 리소스를 가지고 있고 추가적으로 다른 스레드의 리소스를 원할 때3. No preemption – 리소스를 한번 가져가면 작업을 수행하기 전까지는 리소스를 release하지 않는다.4. Circular wait – wait cy..