Chính vì những suy nghĩ như vậy nên xuất hiện một khái niệm mới GPGPU (General-Purpose Computation on GPU ) đó là dùng tính toán GPU để làm những công việc trước kia là của CPU để tăng cường hiệu suất làm việc .
Làm thế nào để làm được việc đó ? Những lập trình viên lập trình cho một GPU nào đó để tăng tốc độ tính toán ứng dụng thông thường nhưng chương trình này sẽ không làm việc trên những GPU kiểu khác .
Để giải quyết vấn đề này ban đầu NVIDIA đã tung ra chương trình dịch C làm việc với những GPU dòng GeForce 8800 có tên gọi là CUDA .
Với CUDA thì bất kì nhà lập trình nào cũng có thể dễ dàng dịch chương trình của mình trong ngôn ngữ C để dùng sức mạnh của GPU hệ thống để xử lí chương trình của mình .
Để tiến thêm một bước xa hơn nữa , NVIDIA tung ra dòng sản phẩm có tên gọi Tesla ( AMD/ATI cũng có dòng sản phẩm với khái niệm tương tự có tên gọi Stream ) . Tesla ban đầu dựa trên sức mạnh của GPU GeForce 8800 nhưng không tạo ra tính hiệu Video : chúng được dùng như là CPU để xử lí chương trình . Trong bài này chúng tôi sẽ nói cho mọi điều mà bạn cần biết về Tesla với nhiều hình ảnh của giải pháp Tesla .
Tất nhiên những chương trình này phải được dịch bằng CUDA . Do đó những người dùng thông thường lại không được hưởng những lợi ích từ công nghệ này . Điều đó có nghĩa là đừng nghĩ rằng khi cài đặt Tesla vào máy tính thì hiệu suất hệ thống của bạn sẽ tự động tăng lên .
Bất kì những chương trình nặng về tính toán mà thực hiện nhiều phép tính song song với nhau có thể được giúp ích từ việc sử dụng GPGPU , tất nhiên chúng phải được biên dịch để dùng với GPU . Ví dụ những chương trình trong lĩnh vực : Vật lí , Tài chính , Y tế , Sinh học và Hoá học .
Một điều rất thú vị về CUDA đó là không cần có Tesla cắm trong máy mới có thể dùng được mà bạn có thể mua bất kì Card màn hình nào thuộc dòng GeForce 8800 ( và GTX200 hiện nay ) là sẽ dùng được GPU thay thế cho CPU để tăng cường hiệu suất làm việc trong những chương trình mà nó hỗ trợ . Nếu nó làm việc tốt thì những nhà lập trình có thể nghĩ về việc mua những hệ thống mạnh hơn đó chính là giải pháp Tesla .
Ban đầu NVIDIA tung ra ba sản phẩm Tesla : Card cơ bản có tên gọi C870 mà là Card màn hình GeForce 8800 nhưng không có tín hiệu ra Video . “C” được viết tắt từ “Card” . C870 có bộ nhớ 1.5GB và có sức mạnh tính toán 500 GigaFLOPS . Nó dùng chuẩn giao diện PCI Express x16 nên có thể cắm C870 vào bất kì máy tính để bàn nào .

Hình 1 : Tesla C870

Hình 2 : C870 không có đầu ra Video
C870 được sử dụng trong hai sản phẩm Tesla khác mà có tên gọi D870 và S870 .
“D” trong D870 có nghĩa là “Desktop” . Nó là một Case ngoài nhỏ gồm có hai Card C870 do đó sức mạnh tính toán theo lí thuyết đạt được 1 TFLOPS . Case này được nối tới PC chính qua Cable thông qua Bus PCI Express mở rộng .
Hình 3 : Tesla D870 có chưa hai Card C870
Với phiên bản cao cấp nhất là Tesla S870 với 04 Card C870 bên trong .
Tesla S870
S trong S870 được bắt nguồn từ “Server” , nó là Case máy chủ kiểu Rack-Mount 1U bên trong có chứa tới 04 Card C870 .
Do đó sản phẩm này được dùng để nối với máy chủ . Trong Hình 4 bạn có thể xem Tesla S870 đã được mở .
Hình 4 : Tesla S870 với 04 Card C870
Tesla S870 được nối tới máy chủ thông qua Cable , mà được dựa trên PCI Express mở rộng . Trong Hình 5 bạn có thể xem đầu nối có sẵn trong S870 để nối với máy chủ và trong Hình 6 và Hình 7 bạn có thể thấy Card PCI Express đã được cắm trong máy chủ

Hình 5 : Đầu nối Tesla S870
Hình 6 : Đây là Card sẽ cắm trong máy chủ

Hình 7 : Nhìn gần đầu nối
Trong Hình 8 bạn có thể thấy Cable được dùng để nối Tesla S870 với máy chủ
Hình 8 :
Nửa cuối tháng Sáu 2008 : NVIDIA vừa cho ra mắt GPU thế hệ tiếp theo dòng GTX200 và tiếp theo họ lại đưa ra thị trường GPGPU Tesla thế hệ tiếp theo .
Tesla bản chất là GPU được cải biến để phục vụ những mục đích tính toán khác ngoài tính toán đồ hoạ . Sản phẩm này có thể trong giống như những Card màn hình nhưng thiếu những đầu ra Video , và NVIDIA ( cũng như ATI ) chế tạo với mục đích dùng trong những ứng dụng tính toán song song chuyên dụng .
Dòng Tesla 10 mới với hai sản phẩm đi kèm . Tesla C1060 Computing Processor nhìn tương tự như Card màn hình có kích thước quá khổ , nó chứa Chip T10P với 240 SP ( Stream Processor ) - hiện nay NVIDIA gọi SP này là Core - tốc độ Core là 1.33GHz , 4GB bộ nhớ 800MHz GDDR3 , Bus nhớ 512-bit . Card này dùng với khe cắm PCIe x16 chuẩn và có công suất tiêu thụ 160W .

Cho những khách hàng muốn sử dụng sức mạnh của GPGPU mà cần kích thước nhỏ , NVIDIA đã giới thiệu hệ thống S1070 1U . Đúng như tên gọi của nó S1070 có kích thước 1U và có tới 04 bộ xử lí T10P có tốc độ 1.5GHz vì thế nó có tới 960 SP , 16GB RAM Video và có băng thông bộ nhớ theo lí thuyết là 408 GB/s . NVIDIA nói rằng hệ thống này tiêu thụ công suất tới 700W .
Cho những ý tưởng sức mạnh tính toán kiểu như những thiết bị như S1070 1U , NVIDIA nói rằng mỗi bộ vi xử lí T10P có chứa tới 1.4 tỉ Transistor và có thể xử lí khoảng 1 TeraFLOP / s . Tốc độ như thế cao gấp hai lần so những bộ xử lí Tesla thế hệ trước kia và độ chính xác tính toán trong dấu phảy động cao gấp đôi ( 64-bit ) và có số lượng bộ nhớ RAM gấp đôi .
Cũng như trước kia , những nhà phát triển sẽ dựa trên ngôn ngữ CUDA (Compute Unified Device Architecture ) để khai thác những sức mạnh tính toán của những sản phẩm Tesla . NVIDIA tuyên bố hiện nay CUDA chạy được với 70 triệu GPU , gồm có cả GeForce và Quadro , và những nhà lập trình không cần phải có những kiếm thức về điều khiển Core vẫn làm việc được tốt .
Nguồn: tuvantinhoc
3Cdotcom “Dịch vụ hosting tốt nhất cho video" www.hosting.net.vn