Phần mềm R là gì? Tính năng của phần mềm R

Cho đến nay, qua chưa đầy 10 năm phát triển, càng ngày càng có nhiều nhà thống kê học, toán học, nghiên cứu trong mọi lĩnh vực đã chuyển sang sử dụng phần mềm R để phân tích dữ liệu khoa học. Vậy phần mềm R là gì? Tính năng của nó ra sao? Cùng tìm hiểu ngay qua bài viết dưới đây.

hinh-anh-phan-mem-r-la-gi-1

1. Khái niệm phần mềm R là gì?

Phần mềm R được xây dưng bởi Ross Ihaka và Robert Gentleman tại  The University of Auckland, New Zealand, tiếp tục được phát triển bởi nhóm R Development Core Team. Phần mềm R là một trong những công cụ phân tích thống kê học cũng như phân tích dữ liệu nói chung.

Trong 10 năm trở lại đây, R đã được nhiều trường đại học trên thế giới sử dụng rộng rãi. Đây là phần mềm mã nguồn mở (miễn phí). Nó mang đầy đủ những tính năng của các phần mềm thương mại khác hiện có như SPSS, AMOS, STATA hay EViews.

2. Tính năng của phần mềm R là gì? 

Phần mềm R có chứa nhiều loại kỹ thuật thống kê (mô hình hóa tuyến tính và phi tuyến, kiểm thử thống kê cổ điển, phân tích chuỗi thời gian, phân loại, phân nhóm, v.v.) và đồ họa. R, giống như S, được thiết kế xoay quanh một ngôn ngữ máy thực thụ, và nó cho phép người dùng thêm các tính năng bổ sung bằng cách định nghĩa các hàm mới.

Cũng có một số khác biệt quan trọng đối với S, nhưng nhiều mã viết bằng S vẫn chạy được mà không cần thay đổi. Nhiều hệ thống trong R được viết bằng chính ngôn ngữ của nó, giúp cho người dùng dễ theo dõi các giải thuật.

Để thực hiện công việc chuyên về tính toán, R có thể liên kết được với ngôn ngữ C, C++và Fortran để có thể được gọi trong khi chạy. Người dùng thông thạo có thể viết mã C để xử lý trực tiếp các đối tượng của phần mềm R.

Phần mềm R cũng có tính mở rộng cao bằng cách sử dụng các gói cho người dùng đưa lên cho một số chức năng và lĩnh vực nghiên cứu cụ thể. Do được thừa hưởng từ S, R có nền tảng lập trình hướng đối tượng mạnh hơn đa số các ngôn ngữ tính toán thống kê khác. Việc mở rộng R cũng dễ dàng nhờ các luật đóng khối từ vựng

Một điểm mạnh khác của phần mềm R là nền tảng đồ họa của nó, có thể tạo ra những đồ thị chất lượng cao cùng các biểu tượng toán học. R cũng có đinh dạng văn bản riêng tương tự như LaTeX, dùng để cung cấp tài liệu hướng dẫn toàn diện, có trực tuyến ở các định dạng khác nhau và cả bản in.

Dù phần mềm R được dùng chủ yếu bởi những nhà thống kê và những người sử dụng khác đòi hỏi một môi trường tính toán thống kê và phát triển phần mềm, nó cũng có thể dùng làm một công cụ tính toán ma trận tổng quát với các kết quả đo đạc cạnh tranh so với GNU Octave và đối thủ thương mại của nó, MATLAB.

Giao diện RWeka đã được thêm vào phần mềm khai phá dữ liệu phổ biến Weka, cho phép đọc/ghi định dạng arff vì vậy cho phép sử dụng tính năng khai phá dữ liệu trong Weka và thống kê trong phần mềm R.

3. Lịch sử phát triển của phần mềm R

Một số mốc quan trọng trong quá trình phát triển.

  • Phiên bản 0.16 – Đây là bản alpha cuối cùng do Ihaka và Gentleman phát triển. Đa số các tính năng cơ bản trong “Sách Trắng” đã được hiện thực. Danh sách gửi thư bắt đầu vào ngày 1 tháng 4 năm 1997.
  • Phiên bản 0.49 – 23 tháng 4 năm 1997 – Đây là bản phát hành mã nguồn cũ nhất, và dịch trên một số hệ điều hành tương tự Unix. CRAN được bắt đầu vào ngày này, với 3 trang gương ban đầu chứa 12 gói. Phiên bản alpha của R dành cho Microsoft Windows và Mac OS đã được đưa lên một thời gian ngắn sau phiên bản này.
  • Phiên bản 0.60 – 5 tháng 12 năm 1997 – R trở thành một phần chính thức của Dự án GNU. Mã nguồn được lưu giữ và bảo trì trên CVS.
  • Phiên bản 1.0.0 – 29 tháng 2 năm 2000 – Được các nhà phát triển xem là đủ ổn định để sử dụng đại trà
  • Phiên bản 1.4.0 – Các phương thức S4 được giới thiệu và phiên bản đầu tiên dành cho Mac OS X được phát hành ngay sau đó.
  • Phiên bản 2.0.0 – Giới thiệu lazy loading, cho phép tải nhanh dữ liệu mà ít tốn bộ nhớ.
  • Phiên bản 2.1.0 – Hỗ trợ mã hóa UTF-8, và bắt đầu quốc tế hóa và bản địa hóa cho các ngôn ngữ khác nhau.
  • Phiên bản 2.9.0 – Gói ‘Matrix’ giờ là gói đề nghị chứa trong bản phân phối R cơ bản.

hinh-anh-phan-mem-r-la-gi-2

4. Tải phần R xuống và cài đặt vào máy tính

Để sử dụng R, việc đầu tiên là chúng ta phải cài đặt phần mềm R trong máy tính của mình. Để làm việc này, ta phải truy nhập vào mạng và vào website có tên là “Comprehensive R Archive Network” (CRAN) sau đây: http://cran.R-project.org

Tài liệu cần tải về, tùy theo phiên bản, nhưng thường có tên bắt đầu bằng mẫu tự R và số phiên bản (version). Chẳng hạn như phiên bản tôi sử dụng vào cuối năm 2005 là 2.2.1, nên tên của tài liệu cần tải là: R-2.2.1-win32.zip

Tài liệu này khoảng 26 MB, và địa chỉ cụ thể để tải là: http://cran.r-project.org/bin/windows/base/R-2.2.1-win32.exe

Tại website này, chúng ta có thể tìm thấy rất nhiều tài liệu chỉ dẫn cách sử dụng R, đủ trình độ, từ sơ đẳng đến cao cấp. Nếu chưa quen với tiếng Anh, tài liệu này của tôi có thể cung cấp những thông tin cần thiết để sử dụng mà không cần phải đọc các tài liệu khác.

Khi đã tải phần mềm R xuống máy tính, bước kế tiếp là cài đặt (set-up) vào máy tính. Để làm việc này, chúng ta chỉ đơn giản nhấn chuột vào tài liệu trên và làm theo hướng dẫn cách cài đặt trên màn hình. Đây là một bước rất đơn giản, chỉ cần 1 phút là việc cài đặt phần mềm R có thể hoàn tất.

Trên đây là bài viết cung cấp cho bạn những thông tin đầy đủ nhất về khái niệm phần mềm R cũng như tính năng của nó và hướng dẫn cài đặt phần mềm R. Nếu trong quá trình làm bài luận bạn còn gặp bất kì thắc mắc gì, hãy liên hệ với chúng tôi qua hotline 096.999.1080 đề được tư vấn giải đáp.

Nguồn: Khoaluantotnghiep.com

Leave a Reply

Your email address will not be published. Required fields are marked *