ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • nvidia-driver, cuda-driver,pytorch 설치
    환경구축 2023. 2. 11. 22:16

    pytorch에서 cuda를 사용하려고하면 설치를 하지 않으면 에러가 난다.

    우선 아래 명령어를쳐보자!

    python
    >>> import torch
    >>> print(torch.cuda.is_available())

    설치가 제대로 되지 않았다면

    리눅스 설치하고 아래 코드를 쳐보면 False가 되었다면 아래 방법으로 설치를 해보자!

     

    검색해보면 여러 방법이 있지만 난 이방법이 최고 좋은 것 같다.

     

    우선 이해가 되어야 설치시 헷갈림을 방지할 수 있다.

    pytorch에서 cuda를 사용하기 위해서 3개를 설치해야한다.

    그리고 순서는 아래와 같다.

    nvidia driver

    -->

    cuda driver

    -->

    pytorch 설치

    맨 번저 해야할 것은 nvidia driver 이다.

    공식 사이트 가면 자동으로 detect 되어서 설치하면 된다.

    https://www.nvidia.co.kr/Download/index.aspx?lang=kr 

     

    Download the latest official NVIDIA drivers

    Download the latest official NVIDIA drivers

    www.nvidia.com

    나의 경우 위와 같았다.

    다운을 받은 후

     sudo ./NVIDIA-Linux-x86_64-525.85.05.run 

    이런식으로 실행하면 된다.

    여기서 버전에대한 고민이되는 그냥 무조건 설치한다.

    nvidia-smi라고 치면 아래와 같이 나왔다.

    nvidia-smi
    
    +-----------------------------------------------------------------------------+
    | NVIDIA-SMI 525.85.05    Driver Version: 525.85.05    CUDA Version: 12.0     |
    |-------------------------------+----------------------+----------------------+
    | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
    |                               |                      |               MIG M. |
    |===============================+======================+======================|
    |   0  NVIDIA GeForce ...  Off  | 00000000:02:00.0 Off |                  N/A |
    | N/A   47C    P3    10W /  30W |      0MiB /  4096MiB |      0%      Default |
    |                               |                      |                  N/A |
    +-------------------------------+----------------------+----------------------+
                                                                                   
    +-----------------------------------------------------------------------------+
    | Processes:                                                                  |
    |  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
    |        ID   ID                                                   Usage      |
    |=============================================================================|
    |  No running processes found                                                 |
    +-----------------------------------------------------------------------------+

    아직 cuda toolkit를 설치하지 않았기 때문에

    nvcc -V를 하면 아무것도 나오지 않을 것이다.

    우리가 필요한 버전은 nvcc-V버전이다.\

    2. cuda toolkit설치하기.

    https://pytorch.org/get-started/locally/

     

    PyTorch

    An open source machine learning framework that accelerates the path from research prototyping to production deployment.

    pytorch.org

    설치하기 전에 확인해야할것이 있다 위 사이트 가서 어떤 버전을 설치해야하는지 확인 해야한다.

    나의 경우 cuda 11.7을 선택했다.

    그러므로 nvcc -V했을 때 11.7이 나오도록 해야한다.

    https://developer.nvidia.com/cuda-toolkit-archive

     

    CUDA Toolkit Archive

    Previous releases of the CUDA Toolkit, GPU Computing SDK, documentation and developer drivers can be found using the links below. Please select the release you want from the list below, and be sure to check www.nvidia.com/drivers for more recent production

    developer.nvidia.com

    위 사이트에서 들어가서 해당 버전을 선택해서 순서대로 한다.

    나의 경우는 11.7을 했다.

    그래서 위 처럼 선택하면 명령어가 나오고 그냥 복사 붙여넣기 하면 된다.

    기존 드라이버 설치되어 있는데 할꺼냐 말꺼냐 물어보는데 무조건 yes 해서 설치한다.

    이러면 아래 처럼 나오는 것을 확인할 수 있을것이다.

    여기서 의문이 들것이다. 굳이 돼 driver설치했지? 내경우 driver설치 없이 그냥 cuda toolkit설치하면 잘 안됐다.

    $ nvidia-smi
    Sat Feb 11 21:36:22 2023       
    +-----------------------------------------------------------------------------+
    | NVIDIA-SMI 515.65.01    Driver Version: 515.65.01    CUDA Version: 11.7     |
    |-------------------------------+----------------------+----------------------+
    | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
    |                               |                      |               MIG M. |
    |===============================+======================+======================|
    |   0  NVIDIA GeForce ...  On   | 00000000:02:00.0 Off |                  N/A |
    | N/A   40C    P8     2W /  N/A |      0MiB /  4096MiB |      0%      Default |
    |                               |                      |                  N/A |
    +-------------------------------+----------------------+----------------------+
                                                                                   
    +-----------------------------------------------------------------------------+
    | Processes:                                                                  |
    |  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
    |        ID   ID                                                   Usage      |
    |=============================================================================|
    |  No running processes found                                                 |
    +-----------------------------------------------------------------------------+

    내경우 nvcc -V  하니까 다른 버전이 나왔는데.

    이경우 당황하지 말고

    아래 처럼 쳐서 11.7로 수정한다.

    /usr/local 에 가보면 설치한  cuda 버전이 있는것을 확인 할 수 있을것이다.

    vim ~/.bashrc
    
    export PATH=/usr/local/cuda-11.7/bin:$PATH
    export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64:$LD_LIBRARY_PATH

    source ~/.bashrc로 업데이트 해주면

    nvcc -V 했을때 원하는 버전이 나오는것을 확인 할 수 있다.

    3. pytorch 설치

    https://pytorch.org/get-started/locally/

     

    PyTorch

    An open source machine learning framework that accelerates the path from research prototyping to production deployment.

    pytorch.org

    그 다음 다시  pytorch사이트로 가서 설치 명령어를 실행한다.

    내 경우 아래와 같았다.

    conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

    이렇게 하면

    pytorch에서 cuda 를 잘 사용할 수 있을것이다.

    $ python
    Python 3.6.10 |Anaconda, Inc.| (default, May  8 2020, 02:54:21) 
    [GCC 7.3.0] on linux
    Type "help", "copyright", "credits" or "license" for more information.
    >>> import torch
    >>> print(torch.cuda.is_available())
    True

    여기서 헷갈리면 안되는것이 conda 에서 다시 torch 를 설치해야한다.

    설치하지 않고 치면 명령어 에러 날것이다.

    반응형

    '환경구축' 카테고리의 다른 글

    환경 구축 category 의 목적....  (0) 2023.02.11
    conda 설치  (0) 2023.02.11
    리눅스 화면 캡쳐  (1) 2023.02.11
    GIT 자주 사용하는 명령어  (0) 2023.02.07
    GIT 환경구축  (0) 2023.02.06
Designed by Tistory.