#!/usr/bin/env bash # projdump.sh - dump project structure and source code into a single text file set -euo pipefail usage() { cat >&2 < Создаёт один файл: -dump.txt — дерево проекта + содержимое исходных файлов Игнорирует типичные артефакты сборки, кэши, IDE-файлы и зависимости. Параметры: -h, --help Показать эту справку EOF } if [[ $# -eq 0 ]] || [[ "$1" == "-h" ]] || [[ "$1" == "--help" ]]; then usage exit 0 fi TARGET_DIR="$1" if [[ ! -d "$TARGET_DIR" ]]; then echo "Ошибка: директория '$TARGET_DIR' не существует." >&2 exit 1 fi # Привести к абсолютному пути TARGET_DIR="$(cd "$TARGET_DIR" && pwd)" BASENAME=$(basename "$TARGET_DIR") # Проверка зависимости if ! command -v tree >/dev/null 2>&1; then echo "Ошибка: требуется утилита 'tree'. Установите её (например, apt install tree)." >&2 exit 1 fi # Расширенный список игнорируемых паттернов # Охватывает: Python, Node.js, Rust, Go, C/C++ (CMake, build dirs), Java, .NET, CI, OS, etc. IGNORE_LIST=( "third_party" "3rd_party" "3rdparty" ".git" ".svn" ".hg" "node_modules" "__pycache__" "*.pyc" ".venv" "venv" "env" ".env" ".idea" ".vscode" ".vs" ".DS_Store" "Thumbs.db" "dist" "build" "out" "target" ".pytest_cache" ".mypy_cache" ".next" ".nuxt" ".output" ".svelte-kit" "coverage" ".cache" ".parcel-cache" ".eslintcache" ".yarn" "yarn-error.log" "package-lock.json" "yarn.lock" "pnpm-lock.yaml" "Cargo.lock" "go.sum" ".gradle" "gradle" ".mvn" "mvnw" "mvnw.cmd" "*.swp" "*.swo" ".stack-work" "_build" "deps" ".cargo" ".rustup" ".clangd" ".ccls-cache" "CMakeFiles" "CMakeCache.txt" "CTestTestfile.cmake" "cmake_install.cmake" "*.dSYM" "*.ilk" "*.pdb" "*.obj" "*.o" "*.so" "*.dylib" "*.dll" "*.exe" "*.bin" "*.hex" "*.elf" "tags" "TAGS" "GPATH" "GTAGS" "GRTAGS" "GSYMS" ".github" ".gitlab" ".circleci" ".travis.yml" "Jenkinsfile" "Dockerfile*" "docker-compose*.yml" "*.log" "logs" "tmp" "temp" ".terraform" ".tfstate" ".tfstate.backup" "*.tfvars" ) # === Подготовка find-аргументов === FIND_IGNORE_ARGS=() for pat in "${IGNORE_LIST[@]}"; do if [[ "$pat" == */* ]]; then FIND_IGNORE_ARGS+=(-o -path "*/$pat") else FIND_IGNORE_ARGS+=(-o -name "$pat") fi done FIND_CMD=(find "$TARGET_DIR" \( -false "${FIND_IGNORE_ARGS[@]}" \) -prune -o -type f -print0) # === Подготовка шаблонов для tree === TREE_IGNORE_PATTERNS="" for pat in "${IGNORE_LIST[@]}"; do # tree работает только с именами, не путями → берём базовое имя base_pat="${pat%%/*}" # Убираем звёздочки? Нет — tree поддерживает glob, но * может мешать. # Однако мы оставляем как есть, т.к. tree -I '*.pyc|node_modules' — нормально. if [[ -z "$TREE_IGNORE_PATTERNS" ]]; then TREE_IGNORE_PATTERNS="$base_pat" else TREE_IGNORE_PATTERNS="$TREE_IGNORE_PATTERNS|$base_pat" fi done OUTPUT_FILE="${BASENAME}-dump.txt" { echo "========================================" echo "PROJECT STRUCTURE (via tree)" echo "========================================" tree -I "$TREE_IGNORE_PATTERNS" "$TARGET_DIR" echo -e "\n\n" echo "========================================" echo "SOURCE CODE CONTENTS" echo "========================================" while IFS= read -r -d '' file; do echo "----------------------------------------" echo "// FILE: $file" echo "----------------------------------------" cat "$file" echo -e "\n" done < <("${FIND_CMD[@]}") } > "$OUTPUT_FILE" echo "Готово: $OUTPUT_FILE"