Metadata-Version: 2.1
Name: ArcDLNexus
Version: 0.1.5
Summary: ArcDLNexus: PythonからWayback Machineのアーカイブ（サイト）をダウンロードするモジュールです。
Home-page: https://github.com/harumaki4649/ArcDLNexus
Download-URL: https://github.com/harumaki4649/ArcDLNexus
Author: ArcDLNexus
Author-email: support@disnana.com
Maintainer: ArcDLNexus
Maintainer-email: support@disnana.com
License: BSD 3-Clause
Classifier: Intended Audience :: Science/Research
Classifier: License :: OSI Approved :: BSD License
Classifier: Programming Language :: Python :: 3
Classifier: Programming Language :: Python :: 3.6
Classifier: Programming Language :: Python :: 3.7
Classifier: Programming Language :: Python :: 3.8
Classifier: Programming Language :: Python :: 3.9
Classifier: Programming Language :: Python :: 3 :: Only
Classifier: Topic :: Scientific/Engineering
Classifier: Topic :: Scientific/Engineering :: Visualization
Classifier: Topic :: Scientific/Engineering :: Artificial Intelligence
Classifier: Topic :: Multimedia :: Graphics
Classifier: Framework :: Matplotlib
Requires-Python: >=3.9
Description-Content-Type: text/markdown
License-File: LICENSE
Requires-Dist: requests ==2.32.2
Requires-Dist: beautifulsoup4 ==4.12.3

# PayNexus

## 目次

>1. [プロジェクトについて](#プロジェクトについて)
>2. [インストール方法](#インストール方法)
>3. [環境](#環境)
>4. [モジュールについて](#モジュールについて)

## プロジェクトについて

PythonからWayback Machineのアーカイブ（サイト）をダウンロードするモジュールです。<br>
>**ベースモジュール**<br>
**公式サイト**<br>
・[公式Github（使い方など）はこちら](https://github.com/harumaki4649/ArcDLNexus)


## インストール方法
>[こちらのPyPIパッケージ](https://pypi.org/project/ArcDLNexus/)を、
```pip install ArcDLNexus```
などのコマンドでインストールしてください。<br>
※お好みでバージョンを指定してください


## 環境

<!-- 言語、フレームワーク、ミドルウェア、インフラの一覧とバージョンを記載 -->

| 言語・フレームワーク  | バージョン |
| --------------------- | ---------- |
| Python                | 3.9.19     |

>モジュール（パッケージ）のバージョンは requirements.txt を参照してください

# モジュールについて
## タスク
 - [x] モジュールを公開する
<!--- 必須マーク : <span style="color:red">＊</span> -->
## ドキュメント
| 関数       | パラメータ                                                     | 説明                                                                                                                                                                              |
|----------|-----------------------------------------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| download | **url** -- str: アーカイブのURL<span style="color:red">＊</span> | アーカイブは次のような形式で、日付が指定されている必要があります。https://web.archive.org/web/{アーカイブの日付}/{サイトのURL}                                                                                               |
|          | **path** -- str: ファイルを保存するフォルダパス                          | c:\のような絶対パスではなく、OSに縛られない./などの相対パスのみサポートしています。デフォルトは「./archive_download」です。                                                                                                      |
|          | **mode** -- str: モード（0～2）                                 | モードは3種類に分けられています。                                                                                                                                                               |
|          |                                                           | モード0 - アーカイブをダウンロードして復元のみ: ウェブページをアーカイブからダウンロードして元の状態に復元し、関連ファイルはダウンロードされず、ページの表示に必要なファイルやリソースはすべてアーカイブ前のURLから取得します。                                                            |
|          |                                                           | モード1 - 関連ファイルを可能な限りダウンロード + モード0の機能: ウェブページのアーカイブをダウンロードし、そのページに関連するファイル（画像、スクリプト、スタイルシートなど）も可能な限りダウンロードし、ページを完全に表示するために必要なすべてのリソースが揃います（手動処理必要）。                               |
|          |                                                           | モード2 - ダウンロードしたファイルで既存の関連ファイルURLを上書き + モード0と1の機能: ウェブページのアーカイブをダウンロードし、関連するすべてのファイルをダウンロードし、必要なファイルやリソースのURLをダウンロードしたファイルのパスに上書きし（ダウンロードできなかった場合はスルー）、ページを完全にオフラインで閲覧できるようにします。 |
    
## 使用例
```python
import ArcDLNexus

ArcDLNexus.download(url="https://web.archive.org/web/20240204090521/https://home.disnana.com/",
                         path="./recovery_archive/",
                         mode=2)

```

※タスクが完了していてもモジュールが更新されていない場合がございます（その際は時間を空けてご確認ください）
