Paper framework

Paper a lightweight Python framework for performing matrix computations on datasets that are too large to fit into main memory. It is designed around the principle of lazy evaluation, which allows it to build a computation plan and apply powerful optimizations, such as operator fusion, before executing any costly I/O operations.

The architecture is inspired by modern data systems and academic research (e.g., PreVision), with a clear separation between the logical plan, the physical execution backend, and an intelligent optimizer.

Architecture

Testing

# Run all tests
python ./tests/run_tests.py

# Run a specific test
python ./tests/run_tests.py addition
python ./tests/run_tests.py fused
python ./tests/run_tests.py scalar

Buffer Manager architecture

Benchmarks

with Dask

8kx8k matrix

==================================================
      BENCHMARK COMPARISON: paper vs. Dask
==================================================
Metric               | Paper (Optimal)      | Dask                
--------------------------------------------------
Time (s)             | 28.79               | 57.00
Peak Memory (MB)     | 1382.03               | 1710.95
Avg CPU Util.(%)     | 170.74               | 169.30
==================================================

16kx16k matrix

Multiplication complete.
--- Finished: Paper (Optimal Policy) in 224.7157 seconds ---

--- Running 'Dask' Benchmark ---

--- Starting: Dask ---
/usr/local/lib/python3.12/dist-packages/dask/array/routines.py:452: PerformanceWarning: Increasing number of chunks by factor of 16
  out = blockwise(
--- Finished: Dask in 467.5384 seconds ---

==================================================
      BENCHMARK COMPARISON: paper vs. Dask
==================================================
Metric               | Paper (Optimal)      | Dask                
--------------------------------------------------
Time (s)             | 224.72               | 467.54
Peak Memory (MB)     | 3970.48               | 4738.61
Avg CPU Util.(%)     | 169.33               | 162.30
==================================================

Name		Name	Last commit message	Last commit date
Latest commit History 67 Commits
.github/workflows		.github/workflows
benchmarks		benchmarks
paper		paper
tests		tests
.gitignore		.gitignore
Decisions.md		Decisions.md
README.md		README.md
basic.py		basic.py
buffer-manager-architecture.svg		buffer-manager-architecture.svg
buffer-manager-shared-position.svg		buffer-manager-shared-position.svg
cache_visualization_eviction_stress.png		cache_visualization_eviction_stress.png
cache_visualization_eviction_stress_32.png		cache_visualization_eviction_stress_32.png
cache_visualization_fast_test.png		cache_visualization_fast_test.png
cache_visualization_large_analysis.png		cache_visualization_large_analysis.png
cache_visualization_large_analysis_new.png		cache_visualization_large_analysis_new.png
cache_visualization_standard.png		cache_visualization_standard.png
paper-architecture.svg		paper-architecture.svg
run_tests.py		run_tests.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Paper framework

Architecture

Testing

Buffer Manager architecture

Benchmarks

Results

About

Uh oh!

Releases

Uh oh!

Contributors 2

Uh oh!

Languages

j143/ooc

Folders and files

Latest commit

History

Repository files navigation

Paper framework

Architecture

Testing

Buffer Manager architecture

Benchmarks

Results

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Uh oh!

Contributors 2

Uh oh!

Languages